Baixe o app para aproveitar ainda mais
Prévia do material em texto
ELAINE REIS COSTA GERAÇÃO AUTOMÁTICA DE MODELOS DIGITAIS DE TERRENO A PARTIR DE IMAGENS DE CÂMARAS DIGITAIS Dissertação de Mestrado Presidente Prudente 2006 Elaine Reis Costa GERAÇÃO AUTOMÁTICA DE MODELOS DIGITAIS DE TERRENO A PARTIR DE IMAGENS DE CÂMARAS DIGITAIS Dissertação apresentada ao Programa de Pós- Graduação em Ciências Cartográficas da Faculdade de Ciências e Tecnologia da UNESP, como parte dos requisitos necessários para a obtenção do título de Mestre em Ciências Cartográficas. Orientador: Prof. Dr. Antonio M. G. Tommaselli Co-orientador: Prof. Dr. Maurício Galo Presidente Prudente 2006 Elaine Reis Costa GERAÇÃO AUTOMÁTICA DE MODELOS DIGITAIS DE TERRENO A PARTIR DE IMAGENS DE CÂMARAS DIGITAIS BANCA EXAMINADORA DEFESA DA DISSERTAÇÃO DE MESTRADO ___________________________________________ Prof. Dr. Antonio M. G. Tommaselli Presidente e orientador ___________________________________________ Prof. Dr. Edson A. Mitshita 2o Examinador ___________________________________________ Prof. Dr. Júlio K. Hasegawa 3o Examinador Presidente Prudente, _____ de _______________ de 2006. Aos meus queridos pais Luiz e Mariza, meus irmãos Ricardo e Camila, e ao meu amado noivo Daniel, por todo amor, incentivo e apoio. Sem vocês não teria sido possível. AGRADECIMENTOS A autora deseja agradecer sinceramente: Aos professores Antonio M. G. Tommaselli e Maurício Galo por toda a dedicação a mim dispensada ao longo destes anos de convivência e pela orientação precisa e segura neste trabalho. Obrigada pela amizade e pela atenção. Sem dúvida vocês são exemplos de ética e profissionalismo que pretendo seguir vida afora. Aos demais professores do Programa de Pós Graduação em Ciências Cartográficas (PPGCC) e do Departamento de Cartografia, que foram essenciais em minha formação. Ao colega Roberto da Silva Ruy que atenciosamente colaborou com esclarecimentos sobre sua implementação do processo de reamostragem epipolar de imagens e a todos os companheiros do PPGCC. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pelo auxílio financeiro dado a esta pesquisa através da bolsa de estudos concedida. A todos que contribuíram para a realização deste trabalho, seja em aspectos científicos ou com palavras de apoio e incentivo. “Tudo posso Naquele que me fortalece” (Filipenses, 4:13) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP RESUMO Os sistemas fotogramétricos digitais existentes atualmente apresentam funções capazes de gerar MDT’s de modo automático, no entanto, problemas na etapa de correspondência de pontos fazem com que a edição desses modelos seja, na maioria das vezes, obrigatória. Nesse sentido, neste trabalho procura-se incorporar ao fluxo da geração de MDT’s, a partir de imagens digitais, alguns procedimentos para tornar a sua geração mais robusta. A metodologia proposta neste trabalho segue a seguinte seqüência: a primeira etapa do processo é a reamostragem epipolar das imagens, o que reduz o espaço de busca para o processo de correspondência. Em seguida faz-se rotulação da imagem através do cálculo de um índice que detecta áreas de sombra, permitindo a aplicação de operações lógicas para eliminar estas áreas. Uma vez definidos os parâmetros de controle do processo de correlação, é realizada a varredura hierárquica do modelo utilizando pirâmide de imagens, sendo determinadas as correspondências. A este processo, foram incorporadas técnicas de pré-análise do processo de correlação, evitando que esta operação seja realizada em áreas inadequadas ao processo de correspondência por área. Determinadas as correspondências, realiza-se uma filtragem dos dados para a eliminação de erros grosseiros e, em seguida, são calculadas as coordenadas tridimensionais dos pontos no referencial do terreno por interseção fotogramétrica. Uma vez gerado o Modelo Digital de Terreno é feito um controle de qualidade com dados de referência já existentes na região. Foram feitos experimentos utilizando imagens tomadas com uma câmara digital Hasselblad, comparando os resultados obtidos com o modelo gerado pelo Sistema Fotogramétrico Digital LPS. Verificou-se que os resultados são compatíveis, o que indica que a abordagem funciona adequadamente. Palavras-chave: Modelo Digital de Terreno, correlação de imagens digitais, reamostragem epipolar, detecção de sombras, redução do espaço de busca. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP ABSTRACT Digital photogrammetric workstations are able to execute Digital Terrain Models (DTM’s) generation automatically but the edition of these models is indispensable due to problems related to correspondence process. Nesse sentido, neste trabalho procura-se incorporar ao fluxo da geração de MDT’s, a partir de imagens digitais, alguns procedimentos para tornar a sua geração mais robusta. A metodologia proposta neste trabalho segue a seguinte seqüência: a primeira etapa do processo é a reamostragem epipolar das imagens, o que reduz o espaço de busca para o processo de correspondência. Em seguida faz-se rotulação da imagem através do cálculo de um índice que detecta áreas de sombra, permitindo a aplicação de operações lógicas para eliminar estas áreas. Uma vez definidos os parâmetros de controle do processo de correlação, é realizada a varredura hierárquica do modelo utilizando pirâmide de imagens, sendo determinadas as correspondências. A este processo, foram incorporadas técnicas de pré-análise do processo de correlação, evitando que esta operação seja realizada em áreas inadequadas ao processo de correspondência por área. Determinadas as correspondências, realiza-se uma filtragem dos dados para a eliminação de erros grosseiros e, em seguida, são calculadas as coordenadas tridimensionais dos pontos no referencial do terreno por interseção fotogramétrica. Uma vez gerado o Modelo Digital de Terreno é feito um controle de qualidade com dados de referência já existentes na região. Foram feitos experimentos utilizando imagens tomadas com uma câmara digital Hasselblad, comparando os resultados obtidos com o modelo gerado pelo Sistema Fotogramétrico Digital LPS. Verificou-se que os resultados são compatíveis, o que indica que a abordagem funciona adequadamente. Keywords: Digital Terrain Model, digital image correlation, epipolar resampling, shadow detection, search space reduction. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP SUMÁRIO 1 INTRODUÇÃO......................................................................................................................... 11 1.1 JUSTIFICATIVA E OBJETIVOS .................................................................................................. 12 2 FUNDAMENTOS TEÓRICOS ................................................................................................... 14 2.1 CONCEITOS GERAIS ............................................................................................................. 14 2.1.1 Definição de Modelo Digitalde Terreno ........................................................................ 14 2.1.2 Terminologia ............................................................................................................... 14 2.1.3 Fontes de Dados para Geração de MDT....................................................................... 15 2.2 IMAGENS DIGITAIS ................................................................................................................ 16 2.2.1 Câmaras digitais ......................................................................................................... 18 2.3 ROTULAÇÃO DE IMAGENS COLORIDAS ..................................................................................... 19 2.3.1 Modelos de cores ........................................................................................................ 20 2.3.1.1 Modelo de cores RGB...............................................................................................................................20 2.3.1.2 Modelo de cores HSI.................................................................................................................................21 2.3.1.3 Transformação RGB – HSI.......................................................................................................................23 2.3.2 Índice de detecção de sombras .................................................................................... 24 2.3.3 Índice de artificialidade ................................................................................................ 24 2.4 CORRESPONDÊNCIA DE IMAGENS ............................................................................................ 25 2.4.1 Correlação de Imagens ............................................................................................... 28 2.4.2 Problemas na correlação de imagens ........................................................................... 32 2.4.3 Redução do Espaço de Busca ..................................................................................... 34 2.4.3.1 Linhas Epipolares .......................................................................................................................................35 2.4.3.2 Normalização..............................................................................................................................................38 2.4.3.3 Paralaxes .....................................................................................................................................................43 2.4.3.4 Hierarquia ....................................................................................................................................................45 2.4.4 Precisão da correlação................................................................................................ 47 2.4.4.1 Variância do ruído ......................................................................................................................................49 2.4.4.2 Estimativa dos parâmetros de translação..............................................................................................50 2.4.4.3 Precisão dos parâmetros de translação.................................................................................................52 2.4.5 Interseção Fotogramétrica .......................................................................................... 53 2.5 AJUSTE DE SUPERFÍCIE......................................................................................................... 55 2.5.1 Estruturas de Dados para MDT's.................................................................................. 56 2.5.1.1 Curvas de Nível..........................................................................................................................................56 2.5.1.2 Malha Regular.............................................................................................................................................57 2.5.1.3 Rede Irregular de Triângulos (TIN) .........................................................................................................59 2.5.1.4 Comparação entre as estruturas .............................................................................................................61 2.6 CONTROLE DE QUALIDADE DE MODELOS DIGITAIS DE TERRENO.................................................... 62 2.6.1 Acurácia das Coordenadas dos Pontos ........................................................................ 63 2.6.1.1 Qualidade da imagem ...............................................................................................................................64 Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 2.6.1.2 Parâmetros de Controle da Correlação..................................................................................................64 2.6.2 Estrutura de dados para a aquisição do MDT................................................................ 67 2.6.3 Validação do MDT....................................................................................................... 68 2.6.3.1 Validação Interna........................................................................................................................................69 2.6.3.2 Validação Externa......................................................................................................................................69 3 MÉTODO PROPOSTO ............................................................................................................. 71 3.1 CONCEITO GERAL DA PROPOSTA............................................................................................. 71 3.1.1 Orientação do estereopar de imagens coloridas ............................................................ 73 3.1.2 Normalização.............................................................................................................. 73 3.1.3 Pré-análise ................................................................................................................. 74 3.1.4 Determinação de áreas de exclusão............................................................................. 75 3.1.4.1 Exclusão de áreas de sombra..................................................................................................................76 3.1.4.2 Exclusão de edificações............................................................................................................................76 3.1.5 Transformação das imagens coloridas em tons de cinza ............................................... 77 3.1.6 Geração da pirâmide de imagens ................................................................................. 77 3.1.7 Correspondência de pontos ......................................................................................... 78 3.1.7.1 Correlação na pirâmide de imagens .......................................................................................................79 3.1.7.2 Geração do mapa de paralaxes...............................................................................................................83 3.1.7.3 Adensamento de pontos nas imagens originais ...................................................................................86 3.1.8 Interseção fotogramétrica ............................................................................................ 89 3.1.9 Controle de qualidade ................................................................................................. 89 3.1.9.1 Controle interno ..........................................................................................................................................90 3.1.9.1.1 Critério paraa exclusão de pontos .................................................................................................95 3.1.9.2 Controle externo.........................................................................................................................................97 3.1.10 Interpolação da malha regular de pontos .................................................................... 98 4 EXPERIMENTOS E RESULTADOS .......................................................................................... 99 4.1 DADOS UTILIZADOS............................................................................................................... 99 4.2 EXPERIMENTOS ..................................................................................................................100 4.2.1 Experimento 1............................................................................................................106 4.2.2 Experimento 2............................................................................................................116 4.2.3 Interpolação de malha regular de pontos .....................................................................120 4.2.3.1 Curvas de nível de referência................................................................................................................120 4.2.3.2 Curvas de nível para os Experimentos 1 e 2.......................................................................................122 4.2.4 Controle externo ........................................................................................................127 5 CONSIDERAÇÕES FINAIS .....................................................................................................131 5.1 CONCLUSÕES .....................................................................................................................131 5.2 RECOMENDAÇÕES PARA TRABALHOS FUTUROS ........................................................................133 REFERÊNCIAS .........................................................................................................................136 Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP LISTA DE FIGURAS Figura 01 – Representação de uma imagem digital........................................................................ 16 Figura 02 – Esquema de uma câmara digital. ................................................................................ 18 Figura 03 – Cubo de cores rgb. .................................................................................................... 21 Figura 04 - Representação de cor no modelo hsi........................................................................... 22 Figura 05 – Correlação digital de imagens..................................................................................... 28 Figura 06 – Plano epipolar e as correspondentes linhas epipolares. ............................................... 35 Figura 07 – Redução do espaço de busca usando informações altimétricas.................................... 36 Figura 08 – Estereopar de imagens normalizadas. ........................................................................ 39 Figura 09 – Geometria do processo de normalização. .................................................................... 40 Figura 10 – Pirâmide de imagens. ................................................................................................ 46 Figura 11 – Fluxograma do processo de obtenção da qualidade da correlação................................ 48 Figura 12 – Mapa altimétrico. ....................................................................................................... 57 Figura 13 – Superfície gerada a partir de grade regular. ................................................................. 59 Figura 14 – Superfície formada a partir de grade triangular irregular. .............................................. 60 Figura 15 – Fluxograma do método proposto. ............................................................................... 72 Figura 16 – Correlação utilizando os n níveis da pirâmide de imagens. ........................................... 80 Figura 17 – Varredura do modelo na imagem esquerda. ................................................................ 81 Figura 18 – Conjunto de pontos projetados dos níveis anteriores para a base da pirâmide. .............. 84 Figura 19 – Pontos interpolados nas linhas com paralaxes conhecidas........................................... 85 Figura 20 – Pontos interpolados entre as duas primeiras linhas com paralaxes conhecidas. ............ 85 Figura 21 – Redução do espaço de busca utilizando o mapa de paralaxes. .................................... 87 Figura 22 – Varredura das imagens originais utilizando o mapa de paralaxes para a redução do espaço de busca. ................................................................................................................ 88 Figura 23 – Distribuição dos pontos correlacionados na etapa de adensamento ao longo de uma linha da área de interesse. ........................................................................................................... 90 Figura 24 – Situações onde o controle de qualidade interno pode ser aplicado. ............................... 91 Figura 25 – Situações onde existe um ponto muito distante do ponto a ser controlado. .................... 92 Figura 26 – Situações onde é realizado o ajuste de uma função linear. ........................................... 93 Figura 27 – Imagem esquerda do estereopar. ..............................................................................100 Figura 28 – Imagem direita do estereopar ....................................................................................100 Figura 29 – Imagem esquerda normalizada. .................................................................................101 Figura 30 – Imagem direita normalizada.......................................................................................103 Figura 31 – Área de interesse na imagem esquerda normalizada. .................................................103 Figura 32 – Imagem resultante do processo de detecção de sombras. ..........................................104 Figura 33 – Imagens esquerda (a) e direita (b) do nível 4 da pirâmide de imagens. ........................105 Figura 34 – Pontos correlacionados na área de interesse no nível 4 da pirâmide. ...........................108 Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP Figura 35 – Pontos correlacionados na área de interesse na imagem esquerda da base da pirâmide. .........................................................................................................................................109 Figura 36 – Pontos correlacionados na área de interesse na imagem direita da base da pirâmide. ..109 Figura 37 – Imagem gerada a partir do mapa de paralaxes. ..........................................................110 Figura 38 – Pontos correlacionados em uma região da área de interesse. .....................................112 Figura 39 – Pontos correlacionados após controle interno para desnível de 5 metros. ....................112 Figura 40 – Pontos correlacionados após controle interno para desnível de 1 metro. ......................113 Figura 41 – Pontos correlacionados em uma região da área de interesse. .....................................114 Figura 42 – Pontos correlacionados após controle interno para desnível de 5 metros. ....................114 Figura 43 – Pontos correlacionados após controle interno paradesnível de 1 metro. ......................115 Figura 44 – Pontos correlacionados na área de interesse no nível 4 da pirâmide. ...........................117 Figura 45 – Pontos correlacionados na área de interesse na imagem esquerda da base da pirâmide. .........................................................................................................................................118 Figura 46 – Pontos correlacionados na área de interesse na imagem direita da base da pirâmide. ..118 Figura 47 – Imagem gerada a partir do mapa de paralaxes. ..........................................................119 Figura 48 – Curvas de nível geradas no lps – estratégia 1.............................................................121 Figura 49 – Curvas de nível geradas no lps – estratégia 2.............................................................121 Figura 50 – Curvas de nível geradas no lps – estratégia 3.............................................................122 Figura 51 – Curvas de nível para o modelo do experimento 1 com limiar de desnível de 5 metros...123 Figura 52 – Curvas de nível para o modelo do experimento 1 com limiar de desnível de 1 metro.....123 Figura 53 – Pontos utilizados para a geração da grade. ................................................................125 Figura 54 – Curvas de nível para o modelo do experimento 2 com limiar de desnível de 5 metros...126 Figura 55 – Curvas de nível para o modelo do experimento 2 com limiar de desnível de 1 metro.....126 Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP LISTA DE TABELAS Tabela 1 – Parâmetros da calibração. ........................................................................................... 99 Tabela 2 – Parâmetros de orientação exterior das imagens e desvios padrão estimados. ...............100 Tabela 3 – Parâmetros adotados para o experimento 1. ...............................................................107 Tabela 4 – Número de pontos projetados ao longo da pirâmide no experimento 1. .........................107 Tabela 5 – Número de pontos correlacionados após o controle interno..........................................115 Tabela 6 – Parâmetros adotados para o experimento 2. ...............................................................116 Tabela 7 – Número de pontos projetados ao longo da pirâmide no experimento 2. .........................116 Tabela 8 – Número de pontos correlacionados após o controle interno. .........................................120 Tabela 9 – Comparação dos Experimentos 1 e 2 com os dados de referência. ...............................128 Tabela 10 – Estatísticas para os MDT’s dos Experimentos 1 e 2. ..................................................129 Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 11 1 INTRODUÇÃO Os Modelos Digitais de Terreno são usados em várias áreas, como Engenharia Civil, ciências da Terra, Fotogrametria, planejamento e gerenciamento de recursos, entre outras, destacando-se como um importante produto para a modelagem e análise da informação topográfica e espacial. Em Fotogrametria, seu uso se destaca no processo de geração de ortoimagens. Para modelar fidedignamente superfícies como a terrestre, seria necessário um número infinito de pontos, o que geraria uma quantidade infinita de dados a serem armazenados. Desta forma, a modelagem se tornaria uma tarefa impossível para qualquer sistema digital. Neste sentido, surgiram as técnicas de modelagem digital do terreno, cujo objetivo é representar superfícies contínuas de forma discreta utilizando para isto uma quantidade finita de dados, ou seja, amostras. A geração automática de MDT’s, a partir de um estereomodelo orientado, compreende três etapas principais (SCHENK, 1996) que são: 1. Correspondência de imagens: consiste em encontrar pontos homólogos; 2. Ajuste de superfície: consiste em interpolar e densificar uma superfície e; 3. Controle de qualidade: verificar e editar o MDT. A etapa de encontrar os pontos homólogos é conhecida como correspondência de imagens (image matching), muitas vezes chamada de correlação de imagens devido ao fato deste ser o método mais utilizado para a determinação de pontos homólogos. Os pontos obtidos na etapa 1 não estão uniformemente distribuídos e não representam completamente a superfície. Mesmo se todos os pixels das imagens fossem correlacionados, haveria pontos que seriam rejeitados, uma vez Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 12 que a correspondência nem sempre é bem sucedida. Assim, existe a necessidade de se realizar a interpolação de pontos para a representação adequada da superfície, através do processo conhecido como ajuste de superfície. Uma vez iniciadas, as etapas 1 e 2 não requerem intervenção do operador. A etapa 3, referente ao controle de qualidade do produto gerado, é de fundamental importância, uma vez que, nos dias de hoje, MDT’s gerados automaticamente ainda requerem edição. Geralmente, esta etapa é realizada manualmente por um operador, ou seja, é basicamente interativa. 1.1 JUSTIFICATIVA E OBJETIVOS A Fotogrametria Digital é o ambiente ideal para a geração automática de MDT’s. Entretanto, apesar dos avanços deste tipo de sistema o problema da geração automática de MDT’s de modo robusto ainda não está totalmente resolvido. Seja, por exemplo, uma área urbana, em grande escala. Nem todos os sistemas digitais existentes são capazes de gerar automaticamente um MDT confiável desta área. Nestes casos, os MDT’s gerados automaticamente não são adequados para a interpolação de curvas de nível, sendo que, para esta tarefa, ainda se faz necessário o operador, que faz a restituição estereoscópica dos contornos. Além disto, deve-se fazer uma ressalva quanto ao uso do termo “automático”. Na geração automática de MDT’s esperar-se-ia que o computador realizasse as mesmas tarefas que um operador executa. Entretanto, isto não é possível, até o momento, sendo importante e necessária a intervenção humana, pelo menos em algumas etapas do processo. Deste modo, os sistemas atuais não são Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 13 independentes e não o serão em curto prazo. Assim, a geração automática de MDT’s é realizada em um ambiente interativo nas estações de trabalho (SCHENK, 1996). Embora a automação seja a principal vantagem da Fotogrametria Digital, no processo de geração automática de MDT's, esta vantagem ainda não produz resultados tão satisfatórios. Mesmo realizando todas as aproximações necessárias, um MDT gerado automaticamente ainda requer muita edição. Norvelle (1996) diz que a quantidade de dados produzidos automaticamente por correlação em quinze minutos requer mais de cinco horas para verificação e edição. Assim, fica claro que a economia feita na automação do processo de geração do MDT é perdida nas etapas de verificação e edição. Desta forma, diante da importância dos Modelos Digitais de Terreno na Fotogrametria e da necessidade de solucionar os problemas que envolvem a sua geração, o objetivo deste trabalho é o estudo e o desenvolvimento de uma metodologia adequada para a geração automática de MDT’s mais confiáveis utilizando imagensdigitais coloridas, além de realizar testes com dados reais para verificar a eficiência do algoritmo adotado. Esta metodologia prevê os seguintes aspectos: a rotulação prévia das áreas de sombras presentes nas imagens, ou seja, uma pré-classificação do estereopar com o cálculo de um índice desenvolvido para a separação de sombras em imagens coloridas; a estimativa da qualidade do processo de correlação, permitindo a exclusão de regiões de baixa potencialidade para a correlação; e a redução do espaço de busca para a correlação, através da reamostragem epipolar, também chamada de normalização, e da varredura hierárquica do estereopar utilizando pirâmides de imagens. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 14 2 FUNDAMENTOS TEÓRICOS 2.1 CONCEITOS GERAIS 2.1.1 Definição de Modelo Digital de Terreno O conceito de modelo digital do terreno é relativamente recente e a introdução do termo Modelo Digital do Terreno é atribuída aos engenheiros Miller e LaFlamme, do Instituto de Tecnologia de Massachusetts (MIT), durante os anos 50 (EL-SHEIMY, 1999). A definição dada por eles é a seguinte: “O MDT é simplesmente uma representação estatística da superfície contínua do terreno por um número elevado de pontos selecionados com coordenadas (X,Y,Z) conhecidas em um sistema de coordenadas arbitrário” (MILLER e LAFLAMME1, 1958 apud EL-SHEIMY, 1999). Uma definição mais recente, apresentada por Mikhail, Bethel e McGlone (2001), diz que o modelo digital de terreno pode ser definido como uma representação digital da superfície terrestre através de um conjunto de pontos. À representação digital está associada uma estrutura de dados, além de funções matemáticas para a realização das interpolações entre os pontos amostrais obtidos. 2.1.2 Terminologia Desde a década de 50, diversos outros termos surgiram para descrever a modelagem digital de terreno. Embora muitas vezes estes termos sejam usados como sinônimos, na realidade eles se referem a produtos distintos. 1 MILLER, C.; LAFLAMME, R. A. The digital terrain modeling - theory and applications. Photogrammetric Engineering, v.24, 1958. p. 433-442. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 15 Segundo Egels e Kasser (2002), o Modelo Digital de Elevações (MDE) é uma representação matemática e digital de um objeto e seu ambiente, como por exemplo, as ondulações do terreno em uma área selecionada. Nota-se pela definição que o termo MDE é um conceito genérico, que pode se referir à elevações do terreno mas também de qualquer nível acima do terreno, como topos de edificações. Quando a informação é limitada às elevações do terreno, o MDE é chamado de Modelo Digital de Terreno (MDT) e fornece informação sobre a elevação de qualquer ponto no terreno. Quando se têm disponíveis as elevações máximas para cada ponto, seja no terreno ou acima dele, o MDE é chamado de Modelo Digital de Superfície (MDS). O MDS contém também as elevações de edificações, árvores, enfim, dos objetos que estão acima da superfície do terreno. Neste trabalho, como o objetivo inicial prevê a eliminação de edificações e árvores para a realização da correspondência, será utilizado o termo MDT para o produto gerado. 2.1.3 Fontes de Dados para Geração de MDT Os dados necessários para a elaboração de um MDT são as elevações de pontos no terreno. Estas elevações podem ser derivadas de curvas de nível digitalizadas, podem ser obtidas por métodos fotogramétricos, ou ainda através de levantamento de campo. Neste trabalho serão abordados aspectos sobre a geração de MDT a partir de dados obtidos por Fotogrametria. Existem duas fontes principais de dados obtidos por Fotogrametria: as fotografias aéreas e as imagens de satélite. Fotografias terrestres também são utilizadas em algumas aplicações. Há atualmente uma grande quantidade de novas fontes de dados, tais como radar e laser altimétrico e radar de abertura sintética (SAR) interferométrico. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 16 2.2 IMAGENS DIGITAIS Uma imagem digital é uma função discreta e bidimensional da intensidade da luz f(x,y), onde x e y denotam as coordenadas espaciais e o valor da função f em qualquer ponto (x,y) é proporcional ao brilho ou nível de cinza da imagem naquele ponto (GONZALEZ e WOODS, 2000). Desta forma, uma imagem digital pode ser entendida como uma matriz, cujas colunas e linhas identificam um ponto na imagem. O elemento da matriz correspondente a este ponto identifica o valor de brilho ou nível de cinza. Os elementos dessa matriz são denominados pixels (picture elements). A Figura 01 ilustra esta definição. Figura 01 – Representação de uma imagem digital. Há duas componentes principais que definem a qualidade de imagens digitais: as resoluções espacial e radiométrica (MIKHAIL, BETHEL e MCGLONE, 2001). A resolução espacial da imagem está relacionada às dimensões i (linhas) j (colunas) (0,0) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 17 do pixel na imagem, ou seja, à taxa de amostragem da imagem e freqüentemente é expressa em pontos por polegada (ppp ou dpi – “dots per inch”). Já a resolução radiométrica da imagem depende dos níveis de quantização adotados. Se uma imagem é quantizada em n bits, ela possuirá 2n valores de brilho. Além destas duas resoluções, existem ainda a resolução temporal, que diz respeito à freqüência com que imagens da mesma região são obtidas; e a resolução espectral, caracterizada pelo número de bandas espectrais em que a imagem é obtida. Estas duas últimas resoluções são mais comuns quando se trata de sensores a bordo de satélites. O sistema de coordenadas de uma imagem digital tem origem (0,0) no seu canto superior esquerdo, sendo a contagem das colunas na direção horizontal e o eixo de contagem das linhas rotacionado de 90° para baixo em relação ao eixo das colunas. Segundo Atkinson (1996) e Tommaselli, Hasegawa e Galo (2000), algumas vantagens do uso de imagens digitais são: § As imagens podem ser visualizadas e medidas em computadores, não havendo a necessidade de equipamentos ópticos ou mecânicos; § Rápida análise e processamento dos dados capturados já que não há necessidade de revelação de filme; § Os sistemas de medidas são estáveis e não necessitam de calibração mecânica; § Grande variedade de resoluções, ou seja, a resolução pode variar de acordo com a necessidade da aplicação; § Podem ser aplicadas técnicas de melhoramentos das imagens; § Também pode ser aplicado o processo de automação; e § As operações podem ser realizadas em tempo real ou quase real. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 18 Os dados digitais podem ser obtidos diretamente por câmaras digitais ou através do processo de digitalização, com o uso de scanners. Neste trabalho, as imagens digitais são adquiridas diretamente através de câmara digital. 2.2.1 Câmaras digitais Câmaras digitais são dispositivos para a coleta e armazenamento de imagens digitais. Segundo Tommaselli,Hasegawa e Galo (2000), uma câmara digital possui um sistema de lentes, um chip CCD ou CMOS, processadores e uma memória para o armazenamento das imagens. A Figura 02 ilustra os componentes de uma câmara digital. Figura 02 – Esquema de uma câmara digital. (Fonte: TOMMASELLI, HASEGAWA e GALO, 2000). Os raios de luz provenientes da cena atingem o sistema de lentes da câmara e são focalizados no sistema sensor CCD (Charge Coupled Device). Em cada célula do sensor é produzida uma carga elétrica proporcional à intensidade da luz incidente (WOLF e DEWITT, 2000). Esta carga elétrica é então amplificada e convertida da forma analógica para um sinal digital, que é armazenado em uma memória temporária (frame buffer). Em seguida, a imagem passa por Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 19 processamentos para a interpolação de cores e compactação e em seguida é armazenada. 2.3 ROTULAÇÃO DE IMAGENS COLORIDAS Antes de iniciar o processo de correspondência de pontos para a geração do MDT é interessante ter um conhecimento preliminar das feições presentes nas imagens, permitindo decidir se tais feições devem pertencer ou não ao MDT. Desta forma, é possível realizar um pré-processamento das imagens, podendo-se fazer a rotulação das imagens com o cálculo de índices. No caso de imagens multiespectrais de baixa resolução existem vários índices que diferenciam alvos baseados em sua resposta espectral. O cálculo destes índices é facilitado devido à característica multiespectral das imagens, além da baixa resolução no terreno. Para imagens aéreas coloridas, o cálculo de tais índices é dificultado. Como as imagens são de alta complexidade (maior escala), as técnicas convencionais de processamento digital nem sempre apresentam resultados satisfatórios. Neste sentido, Polidorio et. al (2003) apresentam algumas técnicas que permitem a separação de alguns alvos em imagens aéreas coloridas. São propostos dois índices: um para separar alvos naturais dos artificiais a partir de decomposições da imagem para o modelo RGB; e outro para a detecção de sombras utilizando decomposição para o modelo HSI. Ambos os índices são obtidos por operações pixel a pixel. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 20 Primeiramente, na seção 2.3.1, serão discutidos alguns aspectos básicos sobre modelos de cores e, em seguida, serão apresentados os índices propostos nas seções 2.3.2 e 2.3.3. 2.3.1 Modelos de cores Segundo Gonzalez e Woods (2000), a proposta de um modelo de cores é facilitar a especificação das cores de acordo com algum padrão consagrado. Na essência, o modelo de cores é uma especificação de um sistema de coordenadas tridimensionais (3-D) e de um sub-espaço dentro deste sistema, onde cada cor é representada por um único ponto. Os modelos de cores mais utilizados em processamento de imagens são o RGB e o HSI, descritos nas seções 2.3.1.1 e 2.3.1.2, de acordo com Gonzalez e Woods (2000). 2.3.1.1 Modelo de cores RGB O modelo de cores RGB (Red, Green, Blue) é baseado em um sistema cartesiano de coordenadas no qual cada cor é representada em função de três componentes primárias que são as cores vermelho (R), verde (G) e azul (B). O subespaço de cores é representado por um cubo, como pode ser visto na Figura 03. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 21 Figura 03 – Cubo de cores RGB. (Fonte: Adaptado de GONZALEZ e WOODS, 2000). No caso de uma imagem quantizada em 8 bits, cada componente de cor varia de 0 a 255 níveis, permitindo diferenciar 16.777.216 cores (2563). Uma imagem no modelo de cores RGB constitui, na verdade, três planos independentes de imagem, um para cada cor primária. Esses três planos combinados produzem composições de cores. Os pontos ao longo da diagonal principal têm valores de cinza normalizados, a partir do preto na origem (0, 0, 0), até o branco (1, 1, 1) na direção oposta, que está no vértice mais afastado da origem. 2.3.1.2 Modelo de cores HSI O modelo HSI (Hue, Saturation, Intensity) é uma representação da cor muito útil por duas razões principais: primeiro porque a componente intensidade (I) pode ser desvinculada da informação de cor de uma imagem (matiz e saturação); segundo porque as componentes de matiz (H) e saturação (S) estão intimamente relacionadas com o processo pelo qual os seres humanos percebem a cor. Esses atributos tornam o modelo HSI ideal para o desenvolvimento de algoritmos de B G R (1,0,0) (0,0,0) (1,1,1) (0,1,0) (0,0,1) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 22 processamento de imagens baseados nas propriedades sensoriais da cor percebida pelo sistema visual humano. Neste modelo, as características usadas para distinguir uma cor de outra são suas componentes de matiz ou tonalidade, saturação e intensidade, conforme ilustrado na Figura 04. Figura 04 - Representação de cor no modelo HSI. (Fonte: Adaptado de GONZALEZ e WOODS, 2000). A intensidade fornece a noção de intensidade de luz e representa a componente acromática da cor; o matiz (hue ou tonalidade) é um atributo relacionado com o comprimento de onda dominante em uma mistura de faixas de luz, ou seja, representa a cor dominante percebida por um observador; e a saturação refere-se à pureza relativa ou quantidade de luz branca misturadas com a cor dominante. As cores do espectro puro são completamente saturadas, sendo que o Branco Intensidade [0,1] Preto R G B P P P’ O Matiz [0, 360º] Saturação = OP/OP’ [0,1] R G B Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 23 ( ) ( )[ ] ( ) ( )( )[ ] −−+− −+− = 2 1 2 BGBRGR BRGR 2 1 arccosH ( ) ( )[ ]B,G,RminBGR 3 1S ++ −= 3 BGR I ++ = seu grau de saturação é inversamente proporcional à quantidade de luz branca que foi acrescida. 2.3.1.3 Transformação RGB – HSI De acordo com Gonzalez e Woods (2000), as componentes H, S e I podem ser obtidas a partir das componentes R, G e B normalizadas no intervalo de [0,1]. A obtenção destas componentes é mostrada nas Equações 01, 02 e 03. (01) onde H = 360º - H se (B/I) > (G/I) (02) (03) Como será mostrado na seção 2.3.2, neste trabalho, para o cálculo do índice detector de sombras, não será utilizada a matiz, somente a saturação e a intensidade. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 24 2.3.2 Índice de detecção de sombras O cálculo do índice de detecção de sombras é realizado utilizando as componentes intensidade (I) e saturação (S) do modelo de cores HSI. Para obter estas componentes, utiliza-se a transformação entre o modelo de cores RGB, que é o modelo original da imagem, e o modelo HSI, no qual será calculado o índice detector de sombras. Os atributos de alta saturação e de baixa intensidade luminosa dassombras permitem a sua detecção através de uma operação simples. Desta forma, o índice para a detecção de sombras SDW (ShaDoW) é calculado simplesmente através da subtração entre as bandas intensidade (I) e saturação (S), como pode ser visto na Equação 04 (POLIDORIO et al., 2003). SDW = I – S Na imagem SDW resultante, as sombras se tornam mais escuras que os demais alvos, permitindo sua separação das demais feições presentes na imagem. Esta separação é realizada através da aplicação de um limiar pré- estabelecido. 2.3.3 Índice de artificialidade O índice NandA (Natural and Artificial) é baseado em operações envolvendo as componentes R, G e B do sistema de cores RGB, sendo calculado através da Equação 05 (POLIDORIO et al., 2003): (04) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 25 NandA = G - (R+B) A resposta espectral da vegetação na banda verde é maior que nas bandas vermelho e azul. Já a resposta dos alvos artificiais (concreto, asfalto, etc) aumenta ao longo do espectro visível. Desta forma, a aplicação deste índice torna as feições naturais mais claras e as artificiais mais escuras, tornando mais fácil o processo de separação e classificação destas feições. 2.4 CORRESPONDÊNCIA DE IMAGENS Um dos processos fundamentais em Fotogrametria é a identificação e medição de pontos homólogos em duas ou mais fotografias sobrepostas. Na Fotogrametria analógica e analítica, esta tarefa é realizada por um operador. Na Fotogrametria digital, este problema pode ser resolvido automaticamente através do processo conhecido como correspondência de imagens, que é um recurso disponível em uma série de sistemas fotogramétricos digitais. A correspondência de imagens está envolvida em praticamente todos os processos fotogramétricos digitais, como a orientação de imagens, geração de modelos digitais de terrenos e extração automática de feições. Segundo Heipke (1996), a correspondência de imagens digitais estabelece automaticamente a correspondência entre primitivas extraídas de duas ou mais imagens digitais desde que elas descrevam, pelo menos parcialmente, a mesma cena. (05) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 26 O que difere os algoritmos de correspondência é o tipo de primitiva utilizada no processo. A classificação dos métodos varia de acordo com os autores. Heipke (1996) considera como primitivas os tons de cinza e as feições presentes nas imagens. Desta forma, classifica os métodos de correspondência em duas categorias: § Correspondência baseada em áreas (Area-Based Matching - ABM): é associada com a correspondência dos tons de cinza das imagens, ou seja, comparam-se os níveis de cinza de pequenas áreas nas duas imagens e a similaridade é medida por correlação estatística, podendo ser seguida por técnicas de mínimos quadrados (Least Squares Matching – LSM). É o método mais usado em Fotogrametria. § Correspondência baseada em feições (Feature-Based Matching - FBM): neste método feições são extraídas nas imagens para a correspondência. Estas feições podem ser locais, tais como pontos, bordas, pequenas linhas e regiões, ou globais, como polígonos ou estruturas, que são descrições mais complexas do conteúdo das imagens. Cada feição é caracterizada por atributos, tais como a posição (coordenadas), orientação e magnitude das bordas (gradientes), comprimento e curvatura de linhas, tamanho e brilho médio de regiões, entre outros. Além dos atributos, podem ser estabelecidas relações entre as feições. Tais relações podem ser geométricas, como o ângulo entre dois lados de polígonos adjacentes ou a distância mínima entre duas bordas; radiométricas, como a diferença entre os tons de cinza ou sua variância entre duas regiões adjacentes; ou ainda topológicas. A correspondência utilizando feições globais é também chamada de correspondência relacional (relational matching). Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 27 Em Schenk (1999) são descritos três métodos de correspondência: § Correspondência baseada em áreas: similar à descrição dada por Heipke (1996); § Correspondência baseada em feições: não inclui a correspondência com feições globais descrita por Heipke (1996) (correspondência relacional); e § Correspondência simbólica (symbolic matching): é o método que compara descrições simbólicas das imagens e mede a similaridade através de uma função de custo. As descrições simbólicas se referem aos níveis de cinza ou às feições derivadas. Podem ser implementadas como grafos, árvores, redes semânticas, entre outras possibilidades. Diferentemente dos outros métodos, a correspondência simbólica não é estritamente baseada nas propriedades geométricas para medir a similaridade. Ao invés de usar a forma como um critério de similaridade, este método compara as propriedades topológicas entre as feições. Para Schenk (1999), a correspondência relacional é um tipo de correspondência simbólica. Em linhas gerais, o problema da correspondência de imagens abrange as seguintes etapas: 1) Selecionar uma primitiva (níveis de cinza, feições ou descrições simbólicas) para correspondência em uma imagem; 2) Encontrar a primitiva conjugada na outra imagem; 3) Calcular a posição tridimensional da primitiva correspondida no espaço objeto; e 4) Avaliar a qualidade da correspondência. Neste trabalho, serão abordadas estas etapas para o método de correspondência de imagens baseado em áreas. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 28 Imagem Esquerda Imagem Direita Janela de Busca Janela de Referência Janela de Pesquisa Embora seja um tópico bem explanado, a correspondência de imagens é um assunto que ainda é objeto de estudo em várias pesquisas, visto que pode apresentar falhas em algumas situações. 2.4.1 Correlação de Imagens A correlação de imagens com precisão ao nível de pixel examina áreas pré-estabelecidas no estereopar de imagens e aplica uma função de correlação ou critério de medida de similaridade aos valores numéricos das funções de tom de cinza (STRAUCH, 1991). Em outras palavras, compara a distribuição dos níveis de cinza de uma janela de referência delimitada na imagem esquerda, também chamada de template, com todas as janelas de pesquisa possíveis dentro de uma janela de busca delimitada na imagem direita. A Figura 05 ilustra esta situação. Figura 05 – Correlação digital de imagens. Existem vários critérios de medida de similaridade, tais como a função erro, onde é feita a subtração dos níveis de cinza entre os pixels das janelas Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 29 e a posição de melhor correlação é aquela na qual a função assume o valor mais próximo de zero; e a função quociente, onde é feita a razão entre os níveis de cinza e a posição de maior similaridade é a mais próxima do valor um. Entretanto, uma das funções mais conhecidas e utilizadas é o coeficiente de correlação, que pode ser expresso pela Equação 06 (HEIPKE, 1996; WOLF e DEWITT, 2000): ( )( ) ( )( )( ) ( )( ) ( )( )∑∑∑∑ ∑∑ = == = = =−− −− = σσ σ =ρ n 0i m 0j 2 PjiP n 0i m 0j 2 RjiR n 1i m 1j PjiPRjiR PR RP gy,xg*gy,xg gy,xggy,xg onde: RPσ é a covariância entre as janelas de referência e de pesquisa; Rσ é o desvio-padrão da janela de referência; Pσ é o desvio-padrão da janela de pesquisa; n, m são o número de colunas e linhas da janela de referência; ( )jiR y,xg é o nível de cinza da posição ( )ji y,x na janela de referência; ( )jiP y,xg é o nível de cinza da posição ( )ji y,x na janela de pesquisa; Rg é a média dos níveis de cinza da janela de referência; e Pg é a média dos níveis de cinza da janela de pesquisa. O fator de correlação varia de -1 a 1. O valor 1 corresponde a medida de similaridade máxima, o valor 0 indica que não há correlação entre as janelas e o valor -1 indica correlação inversa. De forma resumida, o processo de correlação resume-se a quatro etapas fundamentais: (06) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 30 § Seleção de uma sub-imagem de referência em uma imagem; § Seleção da sub-imagem de busca em outra imagem; § Cálculo da correlação; § Identificação dos pontos de máximo ou mínimo para todas as possíveis combinações; e § Verificação da qualidade do processo realizado. A última etapa, ou seja, a verificação da qualidade do processo é de grande importância, uma vez que existem vários fatores que influenciam o processo de correlação a fornecer um resultado falso. Uma vez achada a janela correlacionada ao nível de pixel, pode-se obter um refinamento desta solução utilizando o método dos mínimos quadrados, ou seja, pode-se obter uma solução sub-pixel. Este procedimento é conhecido como correspondência pelos mínimos quadrados e tem a função de minimizar a diferença entre os níveis de cinza da janela de referência e da janela correlacionada (SCHENK, 1999). Neste processo, a posição e o formato da janela correlacionada são os parâmetros calculados no ajustamento, ou seja, estes parâmetros são recalculados até que a diferença nos níveis de cinza entre a janela correlacionada (que varia) e a janela de referência (constante) seja mínima. O formato da janela correlacionada deve ser modificado devido ao efeito das distorções geométricas que ocorrem nas imagens e prejudicam o processo de correlação. Mais detalhes sobre esta formulação, inclusive modelo matemático, pode ser encontrada em Ackermann (1984), Andrade (1998, p.124), Schenk (1999, p.257), Wolf e Dewitt (2000, p.339). Outra possibilidade para encontrar a solução da correspondência com precisão subpixel é o ajuste de uma superfície quadrática ao redor do ponto de máximo ou do Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 31 mínimo da matriz de coeficientes de correlação. As coordenadas subpixel podem ser obtidas estimando o ponto crítico desta função. No método de correspondência de imagens baseado em área alguns pontos devem ser discutidos (SCHENK, 1999): § Localização da matriz de referência: a janela de referência deve ser a melhor possível, de tal forma que não ocorram falhas na correspondência entre as entidades. Tais falhas podem ocorrer devido à homogeneidade da região, oclusão da área selecionada na outra imagem, repetição de padrões, entre outros. Neste sentido, Förstner (1986) desenvolveu o operador de interesse. Este operador determina primeiramente se uma determinada janela de referência possui alto potencial para a correspondência e, em seguida, determina pontos notáveis nestas janelas para a realização da correspondência baseada em feições. Neste trabalho, será utilizada a formulação proposta para selecionar as janelas de referência para a correlação, apresentada na seção 2.4.4. § Dimensão da janela de referência: este ponto deve ser levado em consideração, pois à medida que a dimensão da janela é incrementada, a unicidade da função dos níveis de cinza aumenta, porém o problema das distorções geométricas é mais marcante. § Localização e dimensão da janela de pesquisa: o método de correspondência baseado em área requer boas aproximações, e com isso, métodos de redução do espaço de busca devem ser usados. § Critério de similaridade: os valores obtidos nas medidas de similaridade entre a janela de referência e as janelas de pesquisa devem ser analisados. Para isso, limiares ou outros critérios podem ser usados. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 32 2.4.2 Problemas na correlação de imagens A correspondência de imagens pertence à classe dos problemas inversos, conhecidos por serem mal-condicionados. Um problema é dito mal- condicionado se ocorrerem as seguintes condições (HEIPKE, 1996): o não há garantias de que a solução exista; o não há garantias de que a solução seja única; e o não há garantias de que a solução seja estável para pequenas variações nos dados de entrada. A correspondência de imagens é um processo mal-condicionado uma vez que, dado um ponto em uma imagem, seu ponto correspondente em outras imagens pode: 1. não existir devido à oclusões, atendendo a condição (1); § ter mais de uma possibilidade de correspondência devido à padrões repetitivos nas imagens, atendendo a condição (2); e § não ser estável devido a ruídos presentes nas imagens, atendendo a condição (3). Nesta seção, serão tratados alguns problemas fundamentais da correspondência de imagens. Os programas de geração de MDT’s devem considerá- los e a capacidade de resolvê-los irá determinar a qualidade do produto gerado. Dois problemas principais na correspondência de imagens são: o alto custo computacional, quando a correlação é realizada sobre a imagem inteira; e as ambigüidades, que ocorrem toda vez que a entidade de correspondência não é única e, assim, são encontradas mais de uma solução. O problema do alto custo computacional pode ser minimizado restringindo o espaço de busca para a correlação. As ambigüidades também são conseqüências de se realizar a correlação Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 33 na imagem inteira. Ao reduzir o espaço de busca, diminui-se a probabilidade de entidades ambíguas. Este assunto será abordado na seção 2.4.3. Supondo que o espaço de busca esteja reduzido e que não haja ambigüidades, dado um par de pontos realmente correspondentes, teoricamente a medida de similaridade resultaria no resultado máximo se todos os tons de cinza para todos os pixels das janelas comparadas fossem idênticos. Esta situação seria ideal, entretanto, ela nunca ocorre. Somente em casos hipotéticos, as funções de correlação serão ótimas. Na prática, ruídos, mudanças de iluminação e propriedades de reflexão entre duas imagens consecutivas causam diferença nos níveis de cinza. Estas diferenças são chamadas de distorções radiométricas. Além destes problemas, existem também as distorções geométricas. Segundo Ackermann (1994), estas distorções se devem principalmente aos parâmetros de orientação da câmara diferentes nas imagens e ao efeito do relevo. Segundo Schenk (1999), as duas principais distorções geométricas devido aos diferentes parâmetros de orientação são: § Distorção causada pela diferença na altura de vôo na tomada das imagens: ocasiona escalas diferentes entre as duas imagens. Os pixels das imagens não se relacionam mais,uma vez que se referem a locais diferentes no espaço objeto. Esta distorção se acentua conforme a distância do centro da imagem aumenta; e § Distorção causada pelos diferentes ângulos de rotação entre as duas imagens: quando as imagens apresentam os ângulos de rotação κ, ϕ e ω diferentes. Da mesma forma que na diferença de escala, os pixels das imagens não se relacionam mais, referindo-se a locais diferentes no espaço objeto. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 34 Com relação ao efeito do relevo, quando se tem uma superfície que possui diferentes elevações, os pixels não se conjugam, nem mesmo se o vôo for perfeitamente vertical. Existe ainda uma outra situação que ocasiona distorções geométricas. É o caso das superfícies inclinadas. Se a superfície for inclinada em uma direção paralela à aerobase, não há problemas uma vez que a distorção geométrica será igual em todas as imagens. Porém, se a superfície for inclinada em uma direção perpendicular à aerobase, o efeito da distorção é diferente (Schenk, 1999, p.240). Se a inclinação for tal que se alcance um ângulo crítico, as feições não aparecerão nas outras imagens, ocasionando as oclusões. De acordo com Heipke (1996), devido ao fato de a correspondência ser um problema mal condicionado, devem ser introduzidas algumas restrições para que o problema se torne bem condicionado. Neste sentido, são descritos na seqüência os processos de redução do espaço de busca e de estimativa da precisão do processo de correlação. 2.4.3 Redução do Espaço de Busca Um grande problema da correlação de imagens é a definição do espaço de busca. Se a região de busca para as feições homólogas não for restrita, o custo computacional será elevado e a chance de se ter ambigüidade será elevada, o que aumenta o risco de se ter falsas correspondências. Assim, para evitar cálculos desnecessários e reduzir o custo computacional, é preciso restringir o espaço de busca (WOLF e DEWITT, 2000). Alguns meios para reduzir o espaço de busca na correlação são: o princípio da geometria epipolar, no qual a área de busca é Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 35 reduzida às linhas epipolares; e a busca hierárquica, na qual se utiliza uma pirâmide de imagens. Estes métodos serão apresentados a seguir. Além destes métodos, pode-se utilizar um MDT aproximado ou um MDT já existente da região em questão para a redução do espaço de busca. Esta técnica não será utilizada neste trabalho. 2.4.3.1 Linhas Epipolares A Figura 06 mostra um estereopar com o ponto A no espaço objeto (terreno) e os correspondentes pontos homólogos a1 e a2 no espaço imagem (imagens esquerda e direita respectivamente). O plano definido pelos centros perspectivos (pontos C1, C2) e o ponto A é conhecido como plano epipolar. As interseções do plano epipolar com os planos das imagens produzem as linhas epipolares conjugadas (MIKHAIL, BETHEL e MCGLONE, 2001). Nota-se que as distâncias focais L1 e L2 devem ser ortogonais aos planos imagem. Figura 06 – Plano epipolar e as correspondentes linhas epipolares. (Fonte: Adaptado de MIKHAIL, BETHEL e MCGLONE, 2001). A Linha epipolar a2 a1 Plano Epipolar B C1 C2 L1 L2 Linha epipolar Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 36 Uma característica importante, conseqüência desta geometria, é que, dado um ponto em uma das imagens, o ponto correspondente na outra imagem do par deve, necessariamente, localizar-se sobre a linha epipolar conjugada. Deste modo, se uma feição em uma imagem é selecionada, a linha epipolar que passa pelo ponto correspondente na outra imagem poderá ser obtida se a orientação relativa entre as imagens for conhecida, ou seja, se o estereopar estiver orientado. Deste modo, uma vez conhecida a orientação relativa, as linhas epipolares conjugadas podem ser obtidas e o espaço de busca passa a ser reduzido, deixando de ser bidimensional e passando a ser unidimensional. Para melhor entender o processo, considera-se a Figura 07, que mostra o raio C’p’ (que liga o centro perspectivo e imagem do ponto P na imagem esquerda), com P sendo a feição no espaço objeto com elevação estimada ZP, que pode ser uma altitude média da região. Figura 07 – Redução do espaço de busca usando informações altimétricas. (Fonte: Adaptado de SCHENK, 1999). O raio C’p’ intercepta a superfície no ponto T. Com a altitude estimada do ponto P (ZP) e os parâmetros de orientação da imagem da esquerda é possível projetar o ponto imagem p’, cujas coordenadas se encontram no sistema T C’ C” p’ p” s” i” S P I ZP Datum HP ∆Z Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 37 fotogramétrico, para o sistema do espaço objeto, ou seja, do terreno, a partir das equações de colinearidade inversas (Equação 07). ( ) ( ) fmymxm fmymxm ZZYY fmymxm fmymxm ZZXX E 33P E 23P E 13 E 32P E 22P E 12E 0 E 0 E 33P E 23P E 13 E 31P E 21P E 11E 0 E 0 −+ −+ −+= −+ −+ −+= , onde: ( )PP y,x são as coordenadas do ponto no sistema fotogramétrico na imagem da esquerda; Eijm são os elementos da matriz de rotação para a imagem da esquerda; f é a distância focal da câmara; ( )E0E0E0 Z,Y,X são as coordenadas do centro perspectivo (CP) da câmara para a imagem da esquerda no sistema de terreno; e ( )Z,Y,X são as coordenadas do ponto no sistema de terreno. Como a altitude ZP foi estimada, uma incerteza (∆z) deve ser associada a ela (SCHENK, 1999). Com base em um conhecimento prévio da altimetria da região, este intervalo de incerteza pode ser calculado, obtendo-se os valores de S e I mostrados na Figura 07. Em seguida, o ponto P no sistema de terreno, assim como os extremos do intervalo de incerteza altimétrica S e I são projetados na imagem direita, a fim de gerar uma região de busca s’’, i’’. Esta projeção é realizada através das equações de colinearidade diretas (Equação 08), utilizando os parâmetros de orientação exterior da imagem da direita. (07) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 38 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )D0D33D0D32D0D31 D 0 D 23 D 0 D 22 D 0 D 21 P D 0 D 33 D 0 D 32 D 0 D 31 D 0 D 13 D 0 D 12 D 0 D 11 P ZZmYYmXXm ZZmYYmXXm fy ZZmYYmXXm ZZmYYmXXm fx −+−+− −+−+− −= −+−+− −+−+− −= , onde: Dijm são os elementos da matriz de rotação para a imagem da direita; e ( )D0D0D0 Z,Y,X são as coordenadas do centro perspectivo (CP) da câmara para a imagem da direita no sistema de terreno. Segundo Schenk (1999), as etapas principais para implementar a correspondência ao longo das linhas epipolares são: § Selecionar a entidade que se deseja corresponder na imagem da esquerda (p’); § Estimar a elevação (ZP) de tal entidade e seu intervalo de incerteza (∆z); § Calcular a posição aproximada da entidade na imagem da direita (p’’); § Calcular o intervalo de busca ( ''Sx - '' Ix ); § Realizar a correspondência dentro do intervalo de busca; e § Analisar os valores obtidos para cada posição do intervalo de busca para determinara posição homóloga. 2.4.3.2 Normalização Em geral, as linhas epipolares não são paralelas ao eixo de coordenadas x. Porém, se os parâmetros de orientação forem conhecidos, as imagens podem ser transformadas para suas posições normalizadas, a fim de tornar (08) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 39 as linhas epipolares paralelas nas imagens. Este processo é denominado Reamostragem Epipolar ou Normalização de Imagens e tem por objetivo remover a paralaxe vertical, permitindo a visualização estereoscópica adequada do modelo, como pode ser observado na Figura 08. Além disto, a normalização melhora a qualidade do processo de correspondência, uma vez que as entidades correspondentes se localizam sobre as linhas epipolares conjugadas. A Figura 08 ilustra um estereopar de imagens normalizadas. Figura 08 – Estereopar de imagens normalizadas. (Fonte: RUY et al., 2005). A transformação das imagens originais em imagens normalizadas requer dois passos (CHO, SCHENK e MADANI, 1992; MIKHAIL, BETHEL e MCGLONE, 2001, p.217; SCHENK, 1999, p.301): 1) As imagens do par são transformadas para suas posições verticais através do uso das matrizes de rotação das imagens esquerda e direita; e 2) A partir das imagens verticais, são aplicadas rotações envolvendo as direções dos componentes da base para se chegar à imagem normalizada. Na Figura 09, N1 e N2 representam as imagens normalizadas e F1 e F2 representam as imagens originais. Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 40 Figura 09 – Geometria do processo de normalização. (Fonte: Adaptado de MIKHAIL, BETHEL e MCGLONE, 2001). A primeira transformação das posições originais para as posições verdadeiramente verticais envolve simplesmente a matriz de rotação transposta das imagens originais. Já para transformar as imagens de suas posições verticais para as posições normalizadas, é necessário o cálculo da matriz de rotação da aerobase (MB). Os ângulos de rotação θz e θy da matriz MB, mostrados na Figura 09, podem ser calculados através dos elementos Bx, By e Bz da aerobase, também mostrados XV ZV YV C1 C2 By Bz Bx Aerobase θz θy θx N1 N2 F1 F2 yN1 yN2 xN2 xN1 yF1 yF2 xF1 xF2 Sistema de Coordenadas do Espaço Objeto Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 41 na Figura 9. Já o ângulo θx é calculado em função dos elementos de orientação exterior das imagens originais (CHO, SCHENK e MADANI, 1992). A primeira rotação θz (Equação 09) leva o eixo Xv para o plano vertical que passa pela aerobase. =θ − x y1 z B B tan A segunda rotação θy (Equação 10) torna o já rotacionado eixo Xv paralelo à aerobase. + − =θ − 2 y 2 x z1 y BB B tan Já a terceira rotação θx (Equação 11) fixa o eixo Zv, que já foi rotacionado duas vezes. 2 21 x ϖ+ϖ =θ sendo que ϖ1 e ϖ2 são ângulos de orientação das imagens originais. Calculados os ângulos de orientação, pode-se escrever as matrizes de rotação em cada direção. Para os ângulos θx, θy e θz têm-se, respectivamente, as matrizes de rotação Mx, My e Mz. A matriz de rotação da aerobase pode ser (09) (10) (11) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 42 calculada através da composição destas três matrizes, como pode ser vista na Equação 12. MB = Mx My Mz Sendo: θθ− θθ= )cos()sin(0 )sin()cos(0 001 M xx xxx θθ θ−θ = )cos(0)sin( 010 )sin(0)cos( M yy yy y θθ− θθ = 100 0)cos()sin( 0)sin()cos( M zz zz z Uma vez calculada a matriz MB, sejam M1 e M2 as matrizes de rotação das imagens esquerda (F1) e direita (F2) respectivamente, as matrizes de rotação entre as imagens originais e as normalizadas são dadas por (MIKHAIL, BETHEL e MCGLONE, 2001): MN1 = MB.M1T MN2 = MB.M2T As coordenadas normalizadas (xN,yN) para as imagens esquerda e direita podem ser obtidas a partir das coordenadas originais (xF,yF), também nas imagens esquerda e direita, através da Equação 17. (16) (13) (14) (15) (12) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 43 ( ) ( ) ( ) ( )fmymxm fmymxm fy fmymxm fmymxm fx 333231 232221 333231 131211 NFNFN NFNFN N NFNFN NFNFN N −++ −++ −= −++ −++ −= onde: i jN m são os elementos da matriz de rotação entre as imagens originais (esquerda ou direita) e as normalizadas (Equação 16). A transformação inversa, ou seja, a obtenção das coordenadas originais a partir das coordenadas normalizadas pode ser expressa pela Equação 18: ( ) ( ) ( ) ( )fmymxm fmymxm fy fmymxm fmymxm fx 332313 322212 332313 312111 NNNNN NNNNN F NNNNN NNNNN F −++ −++ −= −++ −++ −= Uma vez que as imagens estão em suas posições normalizadas, os processos de correspondência de pontos podem ser realizados nas mesmas linhas nas duas imagens, o que reduz o espaço de busca para uma dimensão. 2.4.3.3 Paralaxes Como já dito, a reamostragem epipolar faz com que o espaço de busca deixe de ser bidimensional e se torne unidimensional. Porém, nem sempre esta aproximação é suficiente. Resta ainda reduzir o espaço de busca ao longo das (17) (18) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 44 linhas epipolares. Para isto, pode-se utilizar as paralaxes dos pontos correspondentes já determinados como aproximação para pontos subseqüentes. Uma vez encontrado um par de pontos correspondentes, a paralaxe absoluta neste ponto pode ser calculada por pa= xd-xe, onde xe e xd são as coordenadas na imagem da esquerda e direita, respectivamente. Uma vez calculada a paralaxe absoluta no ponto A, a diferença de paralaxe entre este ponto e seu vizinho pode ser estimada pela Equação 19 (WOLF, 1983), que utiliza a paralaxe do ponto inicial, a altura de vôo Hvôo, e uma estimativa de desnível ∆h entre pontos considerados. vôo a H h pp ∆ ⋅=∆ O desnível ∆h máximo entre pontos vizinhos pode ser predito em função de uma declividade máxima da região, em percentual, como pode ser visto na Equação 20: ∆h = Dterreno * Declividade onde Dterreno é a distância entre os pontos no referencial do terreno, calculada por: Dterreno = dpixels * dim * denominador da escala da foto sendo dpixels a distância entre os pontos medida em pixels e dim o tamanho do pixel na direção x. (19) (20) (21) Geração automática de Modelos Digitais de Terreno a partir de imagens de câmaras digitais Programa de Pós Graduação em Ciências Cartográficas FCT/UNESP 45 Deste modo, ao ser definida a posição xe de um ponto na imagem esquerda, próximo do primeiro ponto encontrado e com paralaxe absoluta pa; a posição predita do ponto imagem homólogo
Compartilhar