Análise Topográfica Estereoscópica para Avaliação Postural

•

UFRJ

Artigos e Atualidades

17/01/2023

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Administração

606.822 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

ANÁLISE TOPOGRÁFICA ESTEREOSCÓPICA PARA
AVALIAÇÃO POSTURAL

Alice Fontes

Projeto de Graduação apresentado ao Curso de
Engenharia Eletrônica e de Computação da Escola
Politécnica, Universidade Federal do Rio de Janeiro,
como parte dos requisitos necessários à obtenção do
título de Engenheiro.

Orientador: Mauricio Cagy

Rio de Janeiro
Março de 2019
!ii
ANÁLISE TOPOGRÁFICA ESTEREOSCÓPICA PARA
AVALIAÇÃO POSTURAL
Alice Fontes
PROJETO DE GRADUAÇÃO SUBMETIDO AO CORPO DOCENTE DO CURSO DE
ENGENHARIA ELETRÔNICA E DE COMPUTAÇÃO DA ESCOLA POLITÉCNICA DA
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS
NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE ENGENHEIRO ELETRÔNICO E
DE COMPUTAÇÃO

Rio de Janeiro – RJ, Brasil
Março de 2019
!iii
Declaração de Autoria e de Direitos
Eu, Alice Fontes CPF 143.505.167-00, autora da monografia Análise Topográfica
Estereoscópica para Avaliação Postural, subscrevo, para os devidos fins, as seguintes
informações:
1. A autora declara que o trabalho apresentado na disciplina de Projeto de Graduação da
Escola Politécnica da UFRJ é de sua autoria, sendo original em forma e conteúdo.
2. Excetuam-se do item 1. eventuais transcrições de texto, figuras, tabelas, conceitos e
ideias, que identifiquem claramente a fonte original, explicitando as autorizações
obtidas dos respectivos proprietários, quando necessárias.
3. A autora permite que a UFRJ, por um prazo indeterminado, efetue em qualquer mídia
de divulgação, a publicação do trabalho acadêmico em sua totalidade, ou em parte.
Essa autorização não envolve ônus de qualquer natureza à UFRJ, ou aos seus
representantes.
4. A autora pode, excepcionalmente, encaminhar à Comissão de Projeto de Graduação,
a não divulgação do material, por um prazo máximo de 01 (um) ano, improrrogável, a
contar da data de defesa, desde que o pedido seja justificado, e solicitado
antecipadamente, por escrito, à Congregação da Escola Politécnica.
5. A autora declara, ainda, ter a capacidade jurídica para a prática do presente ato, assim
como ter conhecimento do teor da presente Declaração, estando ciente das sanções e
punições legais, no que tange a cópia parcial, ou total, de obra intelectual, o que se
configura como violação do direito autoral previsto no Código Penal Brasileiro no art.
184 e art.299, bem como na Lei 9.610.
6. A autora é a única responsável pelo conteúdo apresentado nos trabalhos acadêmicos
publicados, não cabendo à UFRJ, aos seus representantes, ou ao(s) orientador(es),
qualquer responsabilização/ indenização nesse sentido.
7. Por ser verdade, firmo a presente declaração.

!iv
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
Escola Politécnica – Departamento de Eletrônica e de Computação
Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária
Rio de Janeiro – RJ CEP 21949-900
Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que
poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar qualquer
forma de arquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecas
deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a ser
fixado, para pesquisa acadêmica, comentários e citações, desde que sem finalidade comercial
e que seja feita a referência bibliográfica completa.
Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es).
!v
AGRADECIMENTOS
À minha família, que tornou tudo isso possível.
Ao meu orientador, pelo suporte, dedicação, incentivo е confiança.
Aos professores que tive o prazer de conhecer durante essa jornada, que
compartilharam seus conhecimentos e contribuíram para a minha formação não apenas
técnica, mas profissional e pessoal.
À esta universidade e a todo o corpo de funcionários, que possibilitaram meus estudos.
Aos amigos que fizeram parte do percurso, obrigada pelo apoio, conselhos e
incentivo.
Ao povo brasileiro que contribuiu de forma significativa à minha formação nesta
Universidade. Este projeto é uma pequena forma de retribuir o investimento e a credibilidade
em mim depositados.
À Deus, pela saúde, força e incontáveis bênçãos.
A todos que direta оu indiretamente fizeram parte dа minha formação, muito obrigada.
!vi
RESUMO
Desvios na coluna vertebral têm-se tornado cada vez mais comuns, especialmente com
os hábitos de vida atuais. Quando identificado um problema de coluna, o paciente é
encaminhado a um tratamento específico e realiza um acompanhamento para saber se o
tratamento está sendo efetivo. Na maioria dos casos, o acompanhamento é feito a cada dois ou
três meses, por meio de consultas de rotina e exames de raios X. O exame de raios X produz
uma radiação ionizante, que, ao longo do tempo, pode causar câncer. Esse é um risco que
aumenta com o número de exposições somadas ao longo da vida do indivíduo. Dado que o
paciente que possui um desvio de coluna será submetido a exames de raios X periodicamente
durante o acompanhamento, mostra-se importante encontrar outra maneira de realizar essa
análise postural. Este projeto propõe o desenvolvimento de um sistema simples e portátil
baseado em estereoscopia capaz de realizar uma análise topográfica das costas do paciente,
bem como a reconstrução em 3D, a fim de, posteriormente, permitir uma avaliação postural.
O sistema estereoscópico foi construído e calibrado de modo que as imagens passaram por um
processo de retificação e correspondência de pontos para gerar um mapa de profundidade,
obtendo-se, finalmente, a adequada reconstrução 3D das costas de um manequim de plástico.
Tendo em vista a simplicidade e o baixo custo, esse sistema foi desenvolvido de modo a ser
facilmente implementado em clínicas e consultórios ortopédicos e fisioterápicos, servindo de
suporte ao especialista. A vantagem desse método é a minimização de erros de paralaxe, o
baixo custo, a facilidade de implementação e a portabilidade, bem como, possivelmente, vir a
substituir a utilização do exame de raios X.
Palavras-Chave: estereoscopia, avaliação postural, análise topográfica, reconstrução
tridimensional.
!vii
ABSTRACT
Deviations of the vertebral column have become increasingly common, especially
with current lifestyle habits. When a spinal problem is identified, the patient is referred to a
specific treatment and a follow-up is performed to see if the treatment is being effective. In
most cases, follow-up is performed every 2 or 3 months by routine visits and X-ray
examinations. X-ray examination produces ionizing radiation, which, over time, can cause
cancer. This is a risk that increases with the number of exposures added over the life of the
individual. Given that the patient who has a spine deviation will undergo X-ray examinations
periodically during follow-up, it is interesting to find another way to perform this postural
analysis. This project proposes the development of a simple and portable system based on
stereoscopy capable of performing a topographic analysis of the patient's back, as well as 3D
reconstruction, in order to subsequently allow a postural evaluation. The stereoscopic system
was built and calibrated, then the images underwent a process of rectification and point
matching to create a depth map, so that one obtained adequate 3D reconstruction of the back
of a plastic dummy. In view of the simplicity and low cost, this system was developed so that
it can be easily implemented in orthopedic and physiotherapeutic clinics, providing support to
the specialist. The advantage of this method is the minimization of parallax errors, low cost,
easy implementation and portability, as well as possibly replacing X-ray usage.
Key-words: stereo imaging, postural evaluation, topographic analysis, three-dimensional
reconstruction.
!viii
LISTA DE ABREVIATURAS E SIGLAS
BM- block matching
cl - ponto principal do plano de imagem esquerdo
cr - ponto principal do plano de imagem direito
cx - coordenada x do centro óptico
cy - coordenada y do centro óptico
cx_left - coordenada x do ponto principal do plano de imagem esquerdo
cx_right - coordenada x do ponto principal do plano de imagem direito
d - disparidade
DLT - Transformada Linear Direta
DSLR - Digital Single Lens Reflex
E - matriz essencial
EI - Escoliose Idiopática
el - epipolo esquerdo
er - epipolo direito
F - matriz fundamental
fl - distância focal da câmera esquerda
fr - distância focal da câmera direita
fx - coordenada x da distância focal
fy - coordenada y da distância focal
mSv - milisievert
Ol - centro de projeção da câmera esquerda
OMS - Organização Mundial da Saúde
Or - centro de projeção da câmera direita
pc - ponto no plano da imagem
Πl - plano de projeção esquerdo
Πr - plano de projeção direito
ply - polygon file format
Po - ponto no mundo físico
Q - matriz de reprojeção
R - matriz de rotação
SAD - soma de diferença absoluta
SGBM - semi-global block matching
T - vetor de translação
UFRJ – Universidade Federal do Rio de Janeiro
xl - coordenada horizontal do ponto na câmera esquerda
xr - coordenada horizontal do ponto na câmera direita
!ix
Z - profundidade
3D - tridimensional
2D - bidimensional
LISTA DE FIGURAS
Figura 3.1: Formação da imagem estereoscópica pelos olhos e cérebro. 17 ............................................
Figura 3.2: Imagem com o uso da profundidade de campo. 18 ................................................................
Figura 4.1: Representação do modelo de câmera pinhole. 21 ...................................................................
Figura 4.2: Representação do sistema de coordenadas no modelo pinhole. 22 ........................................
Figura 4.3: Convertendo da coordenada do objeto para a coordenada da câmera. 23 ..............................
Figura 4.4: à esquerda, um objeto sem distorção e, à direita, o mesmo objeto com distorção radial. 25 .
Figura 4.5: Imagem das câmeras esquerda e direita, com o padrão xadrez encontrado. 27 .....................
Figura 5.1: Com um sistema estéreo perfeitamente alinhado e não distorcido e correspondência
conhecida, a profundidade Z pode ser encontrada por semelhança de triângulos; os raios principais das
câmeras começam nos centros de projeção Ol e Or e se estendem pelos pontos principais dos dois
planos de imagem em cl e cr. 29 ...............................................................................................................
Figura 5.2: A profundidade e a disparidade estão inversamente relacionadas, de modo que a medição
de profundidade refinada é restrita a objetos próximos. 30 ......................................................................
Figura 5.3: Sistema de coordenadas estéreo usado pelo OpenCV para câmeras retificadas e sem
distorção: as coordenadas de pixel são relativas ao canto superior esquerdo da imagem e os dois planos
são alinhados por linha; as coordenadas da câmera são relativas ao centro de projeção da câmera
esquerda. 31 ...............................................................................................................................................
Figura 5.4: O plano epipolar é definido pelo ponto P observado e os dois centros de projeção, Ol e Or;
os epipolos estão localizados no ponto de interseção da linha que une os centros de projeção e os dois
planos de projeção. 33 ...............................................................................................................................
Figura 5.5: A geometria essencial da imagem estéreo é capturada pela matriz essencial E, que contém
todas as informações sobre a translação T e a rotação R, que descrevem a localização da segunda
câmera em relação à primeira em coordenadas físicas. 34 .......................................................................
Figura 5.6: O objetivo é matematicamente (em vez de fisicamente) alinhar as duas câmeras em um
único plano de visualização, de modo que as linhas de pixels entre as câmeras fiquem exatamente
alinhadas entre si. 36 .................................................................................................................................
Figura 5.7: Retificação estéreo: o par de imagens originais, esquerda e direita (painéis superiores) e o
par de imagens retificado, esquerda e direita (painéis inferiores); nota-se que a distorção (no topo do
tabuleiro de xadrez) foi corrigida e as linhas de varredura estão alinhadas nas imagens retificadas. 37 ..
Figura 5.8: Retificação estéreo: para a câmera esquerda e direita, a imagem bruta (a) é tornada sem
distorção (b), retificada (c) e recortada (d) para focar áreas sobrepostas entre as duas câmeras; o
cálculo da retificação funciona de trás para frente, de (c) para (a). 38 .....................................................
Figura 5.9. A correspondência estéreo começa atribuindo correspondências de pontos entre linhas
correspondentes nas imagens esquerda e direita: imagens esquerda e direita de uma lâmpada (painel
superior); uma ampliação de uma única linha de varredura (painel do meio); visualização das
correspondências atribuídas (painel inferior). 40 ......................................................................................
Figura 5.10: Qualquer correspondência na imagem à direita de um recurso na imagem à esquerda deve
ocorrer na mesma linha e no mesmo ponto de coordenada (ou à esquerda dele), onde a pesquisa de
correspondência começa no ponto minDisparity (aqui, 0) e se move para a esquerda para o número
definido de disparidades. 41 ......................................................................................................................
!x
Figura 5.11. Cada linha representa um plano de disparidade constante em pixels inteiros de 20 a 12;
um alcance de busca de disparidade de cinco pixels cobrirá diferentes faixas de "horopters", como
mostrado pelas setas verticais, e diferentes limites de disparidades máximas estabelecem diferentes
“horopters”. 41 ..........................................................................................................................................
Figura 5.12: Uma disparidade fixa forma um plano de distância fixa das câmeras. 42 ............................
Figura 5.13: Exemplo de saída de mapas de profundidade (para uma caneca e uma cadeira) calculados
usando cv.findStereoCorrespondenceBM() e cv2.reprojectImageTo3D(). 43 ..........................................
Figura 6.1: webcams e computador. 45 .....................................................................................................
Figura 6.2: manequim utilizado como dummy postural. 46 .....................................................................
Figura 6.3: folha com padrão xadrez usada para calibração das câmeras. 46 ...........................................
Figura 7.1: Múltiplas imagens coletadas do padrão xadrez em diferentes posições, com as quinas
encontradas. 48 ..........................................................................................................................................
Figura 7.2: Imagens (câmera esquerda e direita) do tabuleiro antes (em cima) e após (embaixo) a
retificação. Observar a área preta nas imagens retificadas, que são referentes aos locais onde não
existem correspondência entre os pontos das imagens, são áreas contempladas apenas por uma das
câmeras. 50 ................................................................................................................................................
Figura 7.3: Linhas horizontais traçadas antes (em cima) e após (embaixo) a retificação. Observar que,
nas imagens acima, os pontos correspondentes não estão na mesma linha. Nas imagens abaixo, é
possível verificar todos os pontos correspondentes nas mesmas linhas, sendo assim linhas epipolares.
51
Figura 7.4: Imagens do dummy remapeadas.52 .......................................................................................
Figura 7.5: Mapa de profundidade. 53 ......................................................................................................
Figura 7.6: Reconstrução 3D. 54 ...............................................................................................................
Figura 7.7: acima, imagens coletadas do dummy. Abaixo, o mapa de profundidade obtido e a
reprojeção 3D. 55 ......................................................................................................................................
Figura 7.8: acima, outras imagens coletadas do dummy. Abaixo, o mapa de profundidade obtido e a
reprojeção 3D. 56 ......................................................................................................................................
Figura 7.9: Mesmo conjunto de imagens estereoscópicas da Figura 7.7, mas com parâmetros diferentes
para a construção do mapa de profundidade (mesmos parâmetros usados na Figura 7.10). 57 ...............
Figura 7.10: Mesmo conjunto de imagens estereoscópicas da Figura 7.8, mas com parâmetros
diferentes na construção do mapa de profundidade. Observa-se a reprojeção 3D diferente. 58 ..............
Figura 7.11: Imagens esquerda e direita do manequim com a reflexão da luz. 59 ...................................
Figura 7.12: Tentativa de mudar o ponto de incidência da luz. 59 ............................................................
Figura 7.13: Tentativa de reconstruir uma mão segurando um caminhão de brinquedo, imagens
coletadas (acima) e retificadas (abaixo). 60 ..............................................................................................
Figura 7.14: Mapa de profundidade da Figura 7.13. 60 ............................................................................
Figura 7.15: Reconstrução 3D da Figura 7.13. 61 ....................................................................................
Figura 7.16: Vista rotacionada da reconstrução 3D da Figura 7.13. 61 ....................................................
Figura 7.17: Outra vista da reconstrução 3D da Figura 7.13, levemente mais rotacionada. 62................
!xi
SUMÁRIO
Capítulo 1
Introdução 1
1.1 – Tema 1 ..............................................................................................................................................
1.2 – Delimitação 1 ...................................................................................................................................
1.3 – Justificativa 1 ...................................................................................................................................
1.4 – Objetivos 2 .......................................................................................................................................
1.5 – Metodologia 3 ..................................................................................................................................
1.6 – Descrição 5 .......................................................................................................................................
Capítulo 2
Motivação 6
2.1 – Problemas posturais 6 ......................................................................................................................
2.1.1 – Escoliose 6 ....................................................................................................................................
2.1.2 – Diagnóstico 7 ................................................................................................................................
2.1.3 – Tratamento 10 ................................................................................................................................
2.2 – Riscos do Exame de Raios X 12 ......................................................................................................
2.3 – Alternativa ao Exame de Raios X 14 ...............................................................................................
Capítulo 3
Métodos 16
3.1 – Fotogrametria 16 ..............................................................................................................................
3.2 – Estereoscopia 16 ...............................................................................................................................
3.3 – Aplicações da estereoscopia 17 ........................................................................................................
3.4 – Construção do sistema estereoscópico 18 ........................................................................................
3.5 – Visão Computacional 19 ..................................................................................................................
Capítulo 4
Calibração de Câmeras 20
4.1 – Modelo da câmera: pinhole 21 .........................................................................................................
4.2 – Parâmetros intrínsecos 22 .................................................................................................................
4.3 – Parâmetros extrínsecos 22 ................................................................................................................
4.4 – Distorções nas lentes 24 ...................................................................................................................
4.5 – Métodos de calibração 25 .................................................................................................................
4.6 – Método escolhido 25 ........................................................................................................................
Capítulo 5
Sistema Estéreo 28
5.1 – Visão 3D 28 ......................................................................................................................................
5.2 – Imagem estéreo 28 ...........................................................................................................................
5.3 – Triangulação 29 ................................................................................................................................
!xii
5.4 – Geometria Epipolar 32 .....................................................................................................................
5.5 – Matriz Essencial e Matriz Fundamental 34 ......................................................................................
5.6 – Calibração Estéreo 35 .......................................................................................................................
5.7 – Retificação Estéreo 35 ......................................................................................................................
5.7.1 – Mapa de retificação 37 ..................................................................................................................
5.8 – Correspondência estéreo 38 .............................................................................................................
5.9 – Mapas de Profundidade e Reprojeção 3D 43 ...................................................................................
Capítulo 6
Materiais 44
6.1 – Desenvolvimento do código 44 ........................................................................................................
6.1.1 – Linguagem Python 44 ...................................................................................................................
6.1.2 – Biblioteca OpenCV 44 ..................................................................................................................
6.1.3 – Editor de texto Atom 45 ................................................................................................................
6.2 – Hardware 45 .....................................................................................................................................
6.3 – Extras 46 ...........................................................................................................................................Capítulo 7
Resultados e discussão 47
7.1 Código Passo-a-passo 47 .....................................................................................................................
7.2 Testes 54 ..............................................................................................................................................
Capítulo 8
Conclusões 64
Bibliografia 66
Apêndice A
Código do Programa para Capturar Imagens do Dummy 69
Apêndice B
Código do Programa para Capturar Imagens de Calibração 71
Apêndice C
Código do Programa de Calibração 73
Apêndice D
Código do Programa de Reconstrução 3D e Mapa de Profundidade 82
!1
Capítulo 1
Introdução
1.1 – Tema
O tema do trabalho é construir um sistema baseado em estereoscopia capaz de realizar
uma análise topográfica das costas do paciente. Essa análise poderá ser usada para avaliação
postural, como uma alternativa a auxiliar os profissionais da área de saúde. Nesse sentido,
busca-se construir o sistema estereoscópico e o algoritmo capaz de realizar esta análise.
1.2 – Delimitação
Desvios na coluna vertebral têm-se tornado cada vez mais comuns, especialmente com
os hábitos de vida atuais. O algoritmo desenvolvido é capaz de realizar uma análise
topográfica estereoscópica das costas do paciente e, assim, identificar possíveis desvios
posturais. Dessa forma, o projeto é voltado para profissionais da área de saúde e ortopedia e
para seus pacientes.
1.3 – Justificativa
Grande parte da população sofre com problemas e dores de coluna. Quando
identificado um problema, o médico encaminha seu paciente a um tratamento específico e
realiza um acompanhamento para saber se o procedimento está sendo efetivo. Na maioria dos
casos, o acompanhamento dá-se por consultas de rotina e pedidos de exames de raios X. Em
média, durante o acompanhamento, a reavaliação do quadro do paciente é feita a cada dois ou
três meses, verificando a necessidade de alterar ou adaptar o programa de exercícios.
O exame de raios X produz uma radiação ionizante, que é uma forma de radiação com
o potencial de prejudicar o tecido vivo. Esse é um risco que aumenta com o número de
exposições somadas ao longo da vida do indivíduo. A radiação é acumulativa e, ao longo do
tempo, pode alterar as células do DNA e causar um câncer. Assim sendo, existe a preocupação
!2
médica de submeter os pacientes a quanto menos exames de raios X for possível, sempre
pesando o custo e o benefício da realização do mesmo.
Como o paciente que possui um desvio de coluna e precisa fazer o acompanhamento
será submetido a exames de raios X periodicamente, mostra-se importante encontrar outra
maneira de realizar essa análise postural.
Anteriormente a este projeto, foi desenvolvido um sistema para análise postural
também estereoscópico, mas baseado na marcação prévia de pontos anatômicos no paciente
com pequenas esferas reflexivas, que servem de pontos de interesse para realizar a análise
postural (CAGY & FONTES, 2018). Apenas as posições 3D destas marcas são estimadas na
reconstrução, tendo sido o algoritmo do sistema implementado na linguagem de programação
Delphi, sem utilização da biblioteca OpenCV. Apesar de simples e de baixo custo, tal sistema
exige o conhecimento prévio dos pontos de interesse onde serão afixadas as marcas
anatômicas, que, caso mal posicionadas, acarretam erros nos cálculos dos ângulos de desvios.
Além disso, este sistema não permite que se opte, após a tomada das imagens, pela utilização
de outro método de avaliação postural que faça uso de outras marcas anatômicas.
Neste sentido, o presente projeto propõe um sistema ainda mais simples, baseado em
uma biblioteca consagrada de Visão Computacional (OpenCV), o qual não requer o uso de
marcas reflexivas. A reconstrução 3D será realizada para toda a superfície das costas do
paciente, de modo que, posteriormente o médico poderá realizar a marcação dos pontos de
interesse (com uso do mouse, por exemplo), já na imagem reconstruída, para o cálculo dos
ângulos de desvios posturais. Dessa forma, tem-se um sistema ainda mais simples que
necessita de menos materiais.
1.4 – Objetivos
Este projeto propõe o desenvolvimento de um sistema simples e portátil baseado em
estereoscopia capaz de realizar uma análise topográfica das costas do paciente, bem como a
reconstrução em 3D, a fim de, posteriormente, fazer uma avaliação postural.
Tendo em vista a simplicidade e o baixo custo, esse sistema foi desenvolvido de modo
a ser facilmente implementado em clínicas e consultórios ortopédicos e fisioterápicos. O
sistema pode servir de suporte ao especialista que, usualmente, baseia-se na simples
visualização do paciente em posição ortostática aliada à imagem radiográfica bidimensional.
!3
As vantagens desse método são a minimização de erros de paralaxe, o baixo custo, a
facilidade de implementação e a portabilidade, bem como possivelmente vir a substituir a
utilização de exames de raios X que, por ser ionizante, não pode ser utilizado em mulheres
grávidas e expõe também os técnicos.
Objetivos Específicos
1. Montar o sistema estereoscópico;
2. Implementar um algoritmo de calibração para o sistema baseado em uma técnica de
calibração simples que demande dispositivos portáteis e de baixo custo;
3. Implementar o algoritmo capaz de gerar um mapa de profundidade e a reconstrução
em 3D da cena;
4. Aplicar o sistema calibrado com um dummy postural para produzir o mapa de
profundidade e a reconstrução 3D.
1.5 – Metodologia
A ideia é realizar a calibração simples e a calibração estéreo de duas câmeras de baixo
custo (webcams), capturar imagens estáticas com as câmeras calibradas, fazer a retificação e
remapeamento das imagens e, a partir dessas imagens remapeadas, gerar um mapa de
profundidade e uma visualização das costas do paciente em 3D por meio do mapa.
Tal sistema permitirá, posteriormente, a marcação de pontos na imagem e, com um
programa de computador baseado em Transformada Linear Direta (DLT), os pontos marcados
poderão ser tridimensionalmente analisados. Assim, será possível calcular ângulos posturais
de interesse. Dessa forma, o sistema auxiliará o especialista no diagnóstico de desvios
posturais como escoliose, cifose e lordose, bem como outros parâmetros posturais como
assimetrias e inclinações.
Como a câmera transforma o mundo 3D em uma imagem em 2D, algumas noções são
perdidas, tais como as dimensões dos objetos. Por exemplo, não é possível comparar
visualmente a altura de duas pessoas se elas não estão à mesma distância da câmera. Objetos
mais distantes ficam menores na imagem 2D. Outra noção perdida é o ângulo entre os objetos
da foto. Entretanto, certas propriedades são preservadas na fotografia. Se desprezarmos as
!4
distorções de imagens causadas pelas lentes, linhas retas no mundo real ainda são linhas retas
na imagem.
A calibração da câmera pode ser feita de diversas maneiras. O objetivo é determinar
um conjunto de parâmetros da câmera que reflitam a transformação das coordenadas do
mundo (em metros) para o sistema da imagem (pixels). Existem parâmetros intrínsecos
(internos à câmera) e extrínsecos (externos à câmera). O cálculo desses parâmetros consiste
na calibração da câmera. Dessa forma, a partir da imagem capturada de duas câmeras, é
possível determinar medidas de posição e tamanho de objetos no ambiente, relacionando-se
pixels correspondentes nas imagens das câmeras para as posições reais no ambiente. Com
todos esses dados, pode-se fazer uma correlação dos pixels correspondentes a cada um dos
pontos nas duas fotos tiradas das costas do paciente com o que elas representam na realidade
permitindo um diagnóstico baseado nessas medidas (BRADSKI & KAEHLER, 2008).
A calibração da câmera é feita pela observação de um objeto que tem a geometria no
espaço 3D conhecida com alta precisão. Com base nas coordenadas previamenteconhecidas
de vários pontos de interesse no objeto de calibração, os parâmetros intrínsecos e extrínsecos
das câmeras são estimados com base nas equações acima visando uma solução de mínimo
erro quadrático. Nesse projeto, são visados o baixo custo e a portabilidade, facilitando sua
implementação em qualquer consultório médico ou fisioterápico.
O procedimento de calibração das câmeras escolhido nesse projeto é realizado a partir
do método do plano com padrão xadrez. Nesse método, move-se um plano com padrão xadrez
dentro do volume de trabalho, fazendo aquisição de múltiplas imagens. Após capturar as
imagens do tabuleiro, com o auxílio da biblioteca OpenCV, serão empregados algoritmos
desenvolvidos com base no método de Zhengyou Zhang (ZHANG, 2000) para detecção de
pontos de interesse nas imagens. Com isso, será possível extrair os parâmetros intrínsecos,
extrínsecos e de distorção das câmeras.
Feita essa calibração simples, é realizada a calibração estéreo, que trata as câmeras em
conjunto, como um sistema estereoscópico. Em seguida, é feita a retificação das imagens para
realizar a correspondência de pontos e, com ela, o mapa de profundidade e a reconstrução 3D
da cena.
Com base na correspondência dos pixels relativos aos pontos de interesse nas fotos
tiradas das costas do paciente pelas duas câmeras, estimam-se suas respectivas posições no
!5
espaço tridimensional, o que permite um diagnóstico baseado nessas medidas. Dessa forma,
espera-se analisar a postura e obter resultados muito próximos ou ainda mais verossímeis que
os obtidos com a radiografia comum.
1.6 – Descrição
O Capítulo 2 apresenta a motivação detalhada da pesquisa. Trata da grande incidência
de problemas posturais, como se dá o diagnóstico e, após, o tratamento. Em seguida, explicita
os riscos do exame de raios X e introduz a ideia de uma alternativa a esses exames.
O Capítulo 3 descreve os métodos que foram utilizados como a fotogrametria e
estereoscopia. São apontados exemplos de aplicações da estereoscopia e detalha como é feita
a construção do sistema estereoscópico. Em seguida, define e explica o que é visão
computacional, conceito também utilizado.
A calibração de câmeras para o sistema estereofotogramétrico é tratada no Capítulo 4.
É exposto o modelo da câmera e são definidos os parâmetros intrínsecos, extrínsecos e de
distorção. Apresenta-se o método de calibração escolhido.
No Capítulo 5, são abordados conceitos de visão estéreo como a projeção,
triangulação, geometria epipolar, matriz essencial, matriz fundamental e correspondência de
pontos. Mostra como é feita a retificação e o uso do mapa de retificação. Explicita como é
feita a reprojeção 3D da imagem e o mapa de profundidade.
O Capítulo 6 trata dos materiais utilizados (software e hardware). No Capítulo 7, são
apresentados os resultados, bem como uma explicação do código passo a passo. As
conclusões são descritas no Capítulo 8.
!6
Capítulo 2
Motivação
2.1 – Problemas posturais
Problemas na coluna afetam grande parte da população. Segundo a Organização
Mundial de Saúde (OMS), 80% das pessoas terão dores nas costas ao longo da vida. Além
disso, conforme a Pesquisa Nacional de Saúde, quase 20% dos brasileiros convive com dores
na coluna decorrentes de problemas crônicos.
A saúde da coluna pode ser comprometida por diversos problemas, causando dores,
dificuldade de locomoção ou impactando diretamente a vida e a rotina do paciente. Entre
esses possíveis problemas está a escoliose.
Segundo a OMS, entre 2% e 3% da população mundial sofre algum grau do desvio
vertebral, representando mais de 7 milhões de diagnósticos. Dados da National Scoliosis
Foundation apontam que, nos Estados Unidos, cerca de 30 mil crianças começam a usar
coletes para o tratamento de escoliose a cada ano.
2.1.1 – Escoliose
A escoliose é um tipo de deformidade na coluna vertebral. A origem depende do tipo
de escoliose (ALEIXO & NEVES, 2013):
1) congênita — caracteriza-se pela má formação das vértebras ainda durante a
gestação;
2) neuromuscular — relacionada à fraqueza muscular, espinha bífida, paralisia
cerebral, entre outros;
3) idiopática — ainda não possui causa conhecida.
Uma pessoa com escoliose pode apresentar dores crônicas na coluna e o tratamento
depende do tamanho da curvatura desenvolvida. O uso de coletes ou a realização de cirurgias
podem ser necessários.
A escoliose idiopática (EI) é a deformidade da coluna vertebral mais comum em
adolescentes (DEBOM et al., 2015), sendo definida como um desvio de mais de 10° no plano
!7
frontal associado com rotação das vértebras e articulações costo-vertebrais, mas sem etiologia
definida.
2.1.2 – Diagnóstico
Para realizar o diagnóstico, o clínico geral, ortopedista ou fisioterapeuta,
primeiramente, investiga o histórico do paciente para identificar se há fatores hereditários que
predispõem a escoliose. O médico também faz perguntas sobre o crescimento recente do
paciente e, assim, traça um histórico clínico. Em seguida, realiza-se o exame físico, no qual
examinará o corpo do paciente em busca de sinais de escoliose. O próximo passo é solicitar
testes de imagem, como radiografia, tomografia computadorizada e exames de ressonância
magnética. Se for o caso, o médico solicita também exames neurológicos. Esses exames
permitem traçar um panorama da estrutura da coluna.
Médicos geralmente realizam exames de escoliose dentro dos exames de rotina, já
que, muitas vezes, a deformidade é silenciosa e às vezes não manifesta sintomas. O problema
pode ser detectado, inclusive, durante o exame físico exigido para a prática de atividades
físicas.
A Sociedade para Pesquisa da Escoliose (Scoliosis Research Society) estabelece os
critérios essenciais para o diagnóstico padrão do desvio, que devem incluir a flexão simples
(teste de Adams) e o exame de raios X.
Abaixo estão listados os possíveis exames a serem realizados no caso de escoliose:
1) Exame físico
Normalmente, é por meio de um exame físico de rotina que se descobre a escoliose
quando ela não causa dores.
O médico examina o paciente de frente e de costas observando se há assimetria na
altura dos ombros, da escápula e da região ilíaca. Lateralmente, observa-se a curvatura normal
(fisiológica) e se há alterações nelas também.
Por meio dessa observação física, o especialista é capaz de identificar se existe algum
grau acentuado de curvatura na coluna. Caso haja, deve-se solicitar exames de imagem para
confirmação e análise específica.
!8
Observando a superfície da pele, também é possível constatar a presença de alterações
do tecido, como manchas ou irregularidades. Esses achados podem ser sinais de outras
doenças ou disfunções que causam a escoliose (ALEIXO & NEVES, 2013).
2) Teste de Adams
Normalmente, durante a realização do exame físico, é feito o teste de Adams. O teste
de Adams é um modo de evidenciar a curvatura indevida da coluna, que consiste em curvar o
tronco para frente e para baixo, como se o paciente fosse pegar alguma coisa do chão ou se
alongar (ALEIXO & NEVES, 2013).
Especificamente no que se refere à escoliose, o teste de Adams tem-se mostrado
bastante útil para o diagnóstico precoce da escoliose idiopática do adolescente (EIA), doença
que se manifesta na infância e na adolescência. Realizado em poucos minutos, esse exame
permite identificar desvios anormais no alinhamento da coluna e assimetrias no tronco (um
lado das costas é mais alto do que o outro) ligados à rotação vertebral e à presença da
gibosidade.
3) Exame neurológico
A função dos exames neurológicos é medir e avaliar a força muscular e se há
alterações dos reflexos ou da sensibilidade. A avaliação é especialmente relevante para
identificar tumores ou condições que acometem o sistema nervoso e que são capazes de irritar
a raiz dos nervos, causando a escoliose (ALEIXO & NEVES, 2013).4) Exames de imagem
Os exames de imagem auxiliam o profissional de saúde a identificar com mais
precisão o local e o grau da escoliose. Podem ser solicitados:
4.1) Raios X
O exame mostra as curvaturas da coluna, apontando se há escorregamento
(sobreposição) de vértebras, artrose, fraturas ou degeneração, lesões por infecção ou tumores.
O exame faz parte do protocolo de diagnóstico da escoliose (ALEIXO & NEVES, 2013).
4.2) Tomografia computadorizada
!9
A tomografia auxilia o médico na avaliação da anatomia óssea e possibilita verificar a
presença de hérnias de disco ou alterações das vértebras.
4.3) Ressonância magnética
A ressonância magnética é capaz de avaliar as estruturas ósseas, mas é especialmente
indicada para verificar partes do corpo como vasos sanguíneos e linfáticos, músculos, tecido
gorduroso e tendões.
5) Ângulo de Cobb
O ângulo de Cobb é considerado o exame de ouro no diagnóstico da escoliose. A
técnica verifica e avalia as deformidades, sendo amplamente utilizada em todo o mundo para
medir a angulação da escoliose a partir da radiografia (ALEIXO & NEVES, 2013).
O Método de Cobb é classicamente empregado para se estimar o grau da curvatura.
Esse método se baseia, mais comumente, na radiografia antero-posterior em posição
ortostática. Pelo exame de imagem, o profissional identifica a primeira e a última vértebras
acometidas pela curvatura incorreta e fará a medição determinando o grau da escoliose.
O ângulo de Cobb é definido como a diferença angular entre o platô superior da
vértebra superior mais inclinada e o platô inferior da vértebra inferior mais inclinada, sendo
diagnosticada a escoliose quando se obtêm ângulos maiores que 10°. Para valores de até 20°,
a escoliose é classificada como leve; entre 20° e 40°, como moderada; e acima de 40°, como
grave, sendo que a cirurgia é indicada para casos com valores acima de 45° (DEBOM et al.,
2015). Sua importância se dá, sobretudo, no encaminhamento terapêutico, uma vez que o
tratamento depende também do grau de angulação.
Em alternativa à estimação do ângulo de Cobb, vários parâmetros têm sido
empregados na análise postural com base na fotogrametria. São eles: ângulo escapular inferior
(IS); ângulo da espinha ilíaca superior posterior (OS); ângulo da linha poplítea (PL); ângulo
dos pés (FA); triângulo de Thales (∆T); ângulo da espinha ilíaca superior anterior (AS);
ângulo de joelho (KA); lordose cervical (CL); cifose torácica (TK); lordose lombar (LL);
flexão de joelho (KF); protrusão de cabeça (HP); inclinação pélvica (PT); ângulo tíbio-tarsal
(TTA); ângulo da articulação acrômio-clavicular (AJ); e ângulo da articulação esterno-
clavicular (SJ) (IUNES et al., 2009).
!10
Segundo um estudo recente, cresceu em 50% o número de pedidos de tomografias e
ressonâncias magnéticas, na maior parte das vezes desnecessários, o que mostra que um bom
diagnóstico é essencial para evitar exageros em relação aos tratamentos (ALEIXO & NEVES,
2013).
2.1.3 – Tratamento
O tratamento da escoliose idiopática (EI) depende do grau e da localização da curva,
levando-se em consideração o crescimento potencial do paciente (DEBOM et al., 2015).
Alguns desvios patológicos de coluna são assintomáticos. Quando os sinais da doença se
manifestam, em geral, o tratamento é conservador e leva em consideração as peculiaridades
de cada caso no que se refere à idade do paciente, ao grau e padrão da curvatura, às
características da deformidade instalada e à intensidade da dor. O objetivo é interromper a
progressão do transtorno, recuperar as funções da coluna vertebral e aliviar os sintomas. Se
for possível identificar a causa do distúrbio, a atenção deve voltar-se também para o controle
da doença de base.
Em geral, as curvaturas consideradas graves o suficiente para serem tratadas são a
partir de 25 graus, mas especialistas destacam que não é somente a angulação de escoliose
que deve determinar o tratamento, mas também os relatos do paciente. A presença de dores,
limitações físicas ou emocionais é determinante para a realização e escolha do
encaminhamento terapêutico (ALEIXO & NEVES, 2013).
Em 2015, foi realizado um encontro de pesquisadores no tratamento de escoliose, a
fim de estabelecer parâmetros para conduzir o paciente. O resultado foi o Consenso SOSORT
– International Conference on Scoliosis 2015, que define os encaminhamentos terapêuticos.
As diretrizes se baseiam sobretudo no tamanho da curvatura da escoliose.
Para pacientes que apresentam uma curvatura entre 0 e 10 graus, em geral, não há
recomendação de tratamento fisioterápico ou cirúrgico. Nesses casos, é necessário realizar a
observação e o acompanhamento, verificando se o desvio está progredindo. A observação é a
primeira intervenção em todos os casos. Ainda que possa parecer uma ausência de tratamento,
ela é, na verdade, um acompanhamento efetivo do quadro e permite que o médico faça
intervenções mais precisas se houver necessidade. Nesse aspecto, exames são solicitados com
frequência regulada e as consultas devem ser periódicas (ALEIXO & NEVES, 2013).
!11
Para escolioses entre 10 e 20 graus, é recomendado o tratamento fisioterápico
específico. O Instituto Brasileiro de Escoliose adota, para o tratamento não cirúrgico, a
abordagem SEAS (Scientific Exercises Approach to Scoliosis). O método consiste na
abordagem de exercícios científicos para a escoliose. Nesse caso, o paciente é submetido a
uma rigorosa avaliação (utilizando os exames físicos, neurológicos e de imagem) e, em
seguida, é elaborado um plano de exercícios específicos para ele. Ou seja, o tratamento é
pautado em padrões de atendimento, mas visa atentar às características e às necessidades
especiais de cada caso, promovendo a individualização do atendimento. Os exercícios
específicos são ensinados ao paciente, que deve se manter atento à forma de realizar, à
duração e à frequência de cada sessão. Assim, é possível que o plano seja continuado em casa,
conforme orientação do profissional. Isso facilita a adesão de pacientes que não moram perto
dos centros de atendimento ou não podem comparecer com frequência às sessões, devido às
condições de locomoção ou questões econômicas, por exemplo.
Devidamente acompanhadas pelo especialista, as técnicas de quiropraxia, pilates e
RPG (Reeducação Postural Globalizada) podem ser usadas como modo de fortalecer a
musculatura, aumentar a resistência e alongar o corpo, auxiliando no tratamento. Órteses,
como palmilhas e coletes ortopédicos, podem ser úteis para deter a progressão da curva e, na
medida do possível, manter ossos e articulações na posição adequada (ALEIXO & NEVES,
2013).
A cirurgia para estabilização da coluna vertebral é recomendada apenas para pacientes
adultos em situações muito especiais. Na escoliose, por exemplo, ela representa uma opção
para corrigir a deformidade somente quando o desvio é superior a 50º, a dor é intensa e há
comprometimento da função pulmonar.
Em média, durante o acompanhamento, a reavaliação do quadro do paciente é feita a
cada dois ou três meses, verificando a necessidade de alterar ou adaptar o programa de
exercícios (ALEIXO & NEVES, 2013). Em caso de uso de colete, verifica-se também a
necessidade da continuação do uso. Esse acompanhamento normalmente é feito solicitando
novos exames de imagem.
!12
2.2 – Riscos do Exame de Raios X
O exame de raios X é um procedimento para diagnóstico médico. Ele é feito usando
radiação ionizante, que utiliza os raios X para gerar uma imagem médica (radiografia) de
diferentes partes do corpo humano.
Segundo a Sociedade Brasileira de Reumatologia, esse exame é contraindicado para
pessoas que não podem ser expostas à radiação. Existe uma contraindicação clássica que é
para gestantes, principalmente na fase inicial da gravidez, porque a radiação pode ter efeitos
maléficos sobre o feto.
A radiação ionizante produzidapelo raio X é uma forma de radiação que tem o
potencial de prejudicar o tecido vivo. Esse risco aumenta com o número de exposições
somadas ao longo da vida do indivíduo. A radiação é acumulativa e, ao longo do tempo, pode
alterar as células do DNA e causar câncer.
O efeito da radiação ionizante no corpo humano difere de acordo com seu tipo e
energia. Os cientistas sabem, há mais de 80 anos, que grandes doses de radiação ionizante
podem danificar os tecidos humanos. Os especialistas tornaram-se cada vez mais preocupados
com os efeitos potencialmente nocivos que a exposição a grandes doses de radiação podem
causar (PUBLIC HEALTH ENGLAND, 2011).
Atualmente, a Comissão Internacional de Proteção Radiológica (ICRP) recomenda
que qualquer exposição acima da radiação natural resultante deve ser mantida tão baixa
quanto possível e abaixo dos limites da dose individual. Com uma abordagem cautelosa,
supõe-se que qualquer nível de exposição possa ter um efeito negativo. Isso significa que há
um aumento no risco de um efeito de saúde proporcional a qualquer dose adicional.
A unidade de medida utilizada para o efeito biológico da radiação sobre o corpo
humano é o milisievert (mSv). A média mundial de exposição à radiação natural é 2,4 mSv
por ano. Sabe-se que doses muito grandes, acima de 5.000 mSv, recebidas por todo o corpo
num curto período de tempo, resultam em morte dentro de poucos dias. Doses acima de 100
mSv podem ter um efeito nocivo nos seres humanos, como uma maior incidência em
desenvolvimento de câncer. Mesmo em doses mais baixas de radiação, abaixo de 100 mSv, há
muita incerteza sobre os efeitos globais (PUBLIC HEALTH ENGLAND, 2011).
!13
Estatisticamente, todos têm uma chance em três de desenvolver câncer em algum
momento de sua vida. A fim de colocar o risco de dano celular causado pela exposição à
radiação na imagiologia médica em alguma perspectiva, a Agência de Proteção da Saúde do
Reino Unido (HPA) tem calculado que:
1) um exame de raios X de tórax, dentes, braços ou pés equivale ao valor de alguns
dias de radiação ambiente e tem menos de uma em 1 milhão de chances de causar câncer;
2) um exame de raios X de crânio ou pescoço equivale ao valor de algumas semanas
de radiação ambiente e tem uma em 100.000 a 1.000.000 chances de causar câncer;
3) um exame de raios X de mamas (mamografia), quadril, coluna vertebral, abdome
ou pelve equivale ao valor de alguns meses a um ano de radiação ambiente e tem uma em
10.000 a 100.000 chances de causar câncer;
4) uma radiografia contrastada com ingestão de bário equivale ao valor de alguns anos
de radiação ambiente e tem uma em 1.000 a 10.000 chances de causar câncer.
Na literatura médica, o câncer é um dos problemas mais associados à radiação. A
radioatividade pode alterar o ‘relógio biológico’ das células, fazendo com que elas cresçam
desordenadamente, formando tumores. Os tumores induzidos pela radiação não aparecem
antes de 10 anos a contar das doses recebidas. Em caso de leucemia, o intervalo cai para dois
anos. Esse período entre a exposição e o aparecimento do câncer é chamado ‘período
latente’ (PIRES, 2011).
Os pesquisadores ainda não têm dados precisos para determinar o risco de câncer
associado a uma dada exposição à radiação, mas existem estimativas. Os médicos relutam em
estabelecer um número, porque, muitas vezes, os benefícios superam os riscos da exposição à
radiação. Entretanto, especialistas dão uma margem segura, considerando exames feitos com
equipamento bem calibrado e profissionais capacitados: até cinco exames de raios X por ano.
Assim, certamente não corre o risco de radiação excessiva. O número serve para adultos e
crianças. A máquina é ajustada conforme o peso e a idade da criança, e a intensidade da
radiação é menor (BIDERMAN, 2010).
Uma média de cinco exames é suficiente para procedimentos de rotina. Em algumas
doenças, pode ser necessário aumentar esse número. Os médicos podem calcular o custo e o
benefício de submeter o paciente a mais radiação. Giovanni Cerri, diretor do Icesp (Instituto
do Câncer do Estado de São Paulo), diz que a preocupação é não realizar exames radiológicos
!14
se não for necessário. A radiação é cumulativa, ou seja, uma dose soma-se à outra, inclusive
com as de outras fontes como a radiação solar.
Dado que a recomendação é fazer o acompanhamento do desvio na coluna de três em
três meses, e visto que normalmente são solicitadas duas radiografias (de frente e de lado), já
somam oito ao ano apenas para acompanhar o desvio de coluna do paciente. Esse número já
aumenta caso ele precise realizar outros exames de raios X ao ano, o que é comum em casos
de sinusite, fraturas, cáries e, até mesmo, outros exames de rotina. Isso ultrapassa a margem
de cinco exames de raios X por ano que é considerada segura. Dessa forma, percebe-se que é
importante encontrar uma alternativa ao exame de raios X.
2.3 – Alternativa ao Exame de Raios X
Nos casos não-cirúrgicos, os pacientes com escoliose idiopática são submetidos a
sessões de tratamento fisioterápico, e são periodicamente reavaliados via exames
radiográficos a cada 3, 6 ou 12 meses, de acordo com a Society on Scoliosis Orthopaedic and
Rehabilitation Treatment (Guideline Committee de 2005).
Como alternativa não-ionizante ao exame radiográfico, a fotogrametria 2D de coluna
tem sido amplamente investigada como ferramenta de avaliação postural, permitindo extrair
informações nos planos frontal (possivelmente, com vistas anterior e posterior) e sagital
(possivelmente, com vistas bilaterais). Não obstante, a aplicação desta técnica depende do
procedimento de obtenção das imagens, e, tal como na análise por radiografia, envolve
subjetividade na estimativa das angulações, apresentando alta variabilidade entre
examinadores (FURLANETTO et al., 2016).
E ainda como alternativa à fotogrametria 2D, a estereofotogrametria permite a
localização tridimensional de pontos de referência com base em duas imagens bidimensionais
coletadas simultaneamente sob pontos de vista deslocados um do outro. Atualmente, com o
avanço tecnológico, sistemas estereofotogramétricos são facilmente implementáveis com o
hardware disponível, permitindo-se a aquisição simultânea das imagens de várias câmeras
(deixando de ser, estritamente falando, um sistema estereoscópico) e, inclusive, de vídeo. Tais
sistemas têm sido empregados para a análise quantitativa do movimento humano, o que tem
lugar tanto na área da saúde como métodos clínicos de cinesiologia e biomecânica quanto, por
!15
exemplo, no aumento do realismo em filmes por animação (ZHANG, 2000; BORGHESE,
2001).
!16
Capítulo 3
Métodos
Significado de estereofotogrametria, de acordo com o dicionário Aulete: fotogrametria
que envolve o uso de fotografias estereoscópicas; fotogrametria estereoscópica. É a aplicação
da fotografia aérea à topografia com o emprego dos processos da estereoscopia.
3.1 – Fotogrametria
A fotogrametria (derivada do grego: luz, descrição e medidas) é definida como a
ciência aplicada, a técnica e a arte de extrair de fotografias métricas, a forma, as feições, as
dimensões e a posição dos objetos nelas contidos (MACEDO, 2014).
Estereofotogrametria é uma técnica mais sofisticada da fotogrametria, onde são
estimadas coordenadas de pontos de um objeto tridimensional. Estes pontos são determinados
por medidas feitas em duas ou mais fotografias obtidas em diferentes posições.
3.2 – Estereoscopia
Estereoscopia é uma técnica usada para se obter informações do espaço
tridimensional, por meio da análise de duas imagens obtidas em pontos diferentes. É um
fenômeno natural que ocorre em muitos animais com dois pontos de visão e também no ser
humano, quando uma pessoa observa em seu redor uma cena qualquer. O fato de o ser
humano ter dois olhos permite-lhe, por meio da estereoscopia, ter a noção de profundidade
espacial,com o objetivo de, por exemplo, ter a noção da distância a que se encontram os
objetos (Figura 3.1). A estereoscopia humana é a análise de duas imagens da cena que são
projetadas nos olhos em pontos de observação ligeiramente diferentes (distância pupilar),
sendo que o cérebro funde as duas imagens no córtex visual, e, nesse processo, o indivíduo
obtém informações quanto à profundidade, distância, posição e tamanho dos objetos, gerando
uma sensação de visão tridimensional (MACEDO, 2014).
!17

Figura 3.1: Formação da imagem estereoscópica pelos olhos e cérebro.
Fonte: RIBAS, GC; RIBAS, EC; RODRIGUES, Jr AJ, 2006.
A pesquisa alerta também os profissionais e pesquisadores brasileiros que a tecnologia
estereoscópica cresce a cada ano, e tem grande chance de substituir, num futuro não muito
distante, os aparelhos tradicionais de exibição de imagens, como televisores, monitores de
computador, telas de celulares e palm-tops, além de começar a se inserir em outras aplicações
das mais variadas (MASCHIO, 2008).
3.3 – Aplicações da estereoscopia
A estereoscopia pode ser utilizada para aplicações comerciais tais como a cartografia,
telecomunicações, exploração mineral, transportes, meio ambiente, planejamento urbano e
engenharia florestal, entre muitas outras áreas. Ela é largamente usada em sistemas de vídeo e
de processamento de imagem, para, por exemplo, com um número variado de câmeras de
vídeo (duas ou mais), o sistema computacional associado calcular a posição 3D, o tamanho ou
a velocidade dos objetos. Esta análise computacional é possível por meio de processamento
de imagem, pois são conhecidas as características intrínsecas das câmeras (distância focal,
tipo de lente, etc.), as suas posições 3D no espaço e as suas orientações tridimensionais
(COSTA & COSME, 2008).
Por meio da Estereoscopia, é também possível a confecção de Cartas Topográficas,
num processo chamado restituição, no qual um operador é capaz, a partir de duas fotografias
aéreas, ver a imagem de um terreno em três dimensões, sendo, assim, capaz de desenhar o que
vê num aparelho restituidor (COSTA & COSME, 2008).
Uma aplicação de estereoscopia com o uso de duas câmeras que ficou bastante
conhecida ultimamente é nos smartphones. Muitos modelos recentes vêm com duas câmeras
que, entre outras melhorias, introduziu a profundidade de campo.
!18
A profundidade de campo permite realizar o efeito de desfocar gradualmente o fundo
da imagem e destacar apenas o objeto principal da foto (Figura 3.2), assim como fazem as
câmeras DSLR por meio de lentes adequadas (também chamado de efeito Bokeh).
Para reproduzir esse efeito, utilizam-se as duas câmeras ao mesmo tempo para
processar a cena em tempo real e destacar o objeto do plano de fundo, criando um desfoque
muito bom no cenário. O uso das duas câmeras, assim como nas imagens em 3D, permite que
o celular tome conhecimento da profundidade da imagem, o que permite desfocar o que está
ao redor do motivo da fotografia.

Figura 3.2: Imagem com o uso da profundidade de campo.
Fonte: RADCLIFFE, 2016.
3.4 – Construção do sistema estereoscópico
Para a construção de um sistema estereoscópico, são necessárias duas imagens de uma
mesma cena obtidas em pontos diferentes. Para isso, são utilizadas duas câmeras de baixo
custo do tipo webcams.
Com isso, um sistema estereoscópico foi desenvolvido para ter essa noção de
profundidade e visualização 3D e, assim, reconstruir as costas do paciente.
!19
3.5 – Visão Computacional
A visão computacional é o processo de modelagem e replicação da visão humana
usando software e hardware. É uma disciplina que estuda como reconstruir, interromper e
compreender uma cena 3D a partir de suas imagens 2D em termos das propriedades da
estrutura presente na cena. A visão computacional é totalmente baseada na visão humana e
trabalha com o processo de modelagem e replicação dessa visão usando softwares e
hardwares avançados (DATA SCIENCE ACADEMY, 2018).
As aplicações da visão computacional vão da medicina à robótica industrial. Uma das
mais difundidas aplicações da visão computacional é a medicina, com o processamento de
imagens médicas. Tal área é caracterizada pela extração de informação de imagens para
realizar diagnósticos sobre os pacientes. Na medicina, o processamento de imagens de
microscopia, de radiografia, de angioplastia, de ultrassonografia, de tomografia e de
ressonância magnética visa fornecer diagnósticos mais precisos sobre os pacientes. Na
indústria, a visão computacional busca prover qualidade e cálculo de posição e orientação de
detalhes para um braço robótico, por exemplo. Sub-campos de pesquisa incluem reconstrução
de cena, detecção de eventos, reconhecimento de objetos, aprendizagem de máquina e
restauração de imagens (DATA SCIENCE ACADEMY, 2018).
O primeiro passo que torna possível os processos de visão por computador é a
calibração das câmeras utilizadas (TRUCCO; VERRI, 1998). Nesse processo, são utilizados
padrões conhecidos, com coordenadas conhecidas no mundo 3D.
Uma câmera pode ser utilizada para extração de várias informações referentes à cena.
Quando essas informações envolvem grandezas geométricas (como comprimento, ângulos,
distância, entre outras), é necessário conhecer os parâmetros de calibração da câmera.
!20
Capítulo 4
Calibração de Câmeras
Em um sistema de visão 3D há necessidade de duas câmeras, de preferência idênticas,
onde ambas estejam configuradas e posicionadas corretamente. Qualquer alteração entre elas
pode causar erros nas medidas. Em grande parte desses sistemas, consegue-se essa exatidão
por meio da calibração de câmeras.
Assim sendo, em sistemas estereofotogramétricos, é necessário que o conjunto de
câmeras esteja calibrado. Define-se como calibração da câmera o processo realizado para
calcular o valor dos parâmetros intrínsecos, extrínsecos e coeficientes de distorção da lente.
Como a câmera transforma o mundo 3D em uma imagem em 2D, algumas noções são
perdidas, tais como as dimensões dos objetos. Por exemplo, não é possível comparar
visualmente a altura de duas pessoas se elas não estão à mesma distância da câmera. Objetos
mais distantes ficam menores na imagem 2D. Outra noção perdida é o ângulo entre os objetos
da foto. Entretanto, certas propriedades são preservadas na fotografia. Se desprezarmos as
distorções de imagens pelas lentes, linhas retas no mundo real ainda são linhas retas na
imagem e linhas paralelas interceptam a imagem no ponto de fuga.
A calibração da câmera pode ser feita de diversas maneiras. O objetivo é determinar
um conjunto de parâmetros da câmera que reflitam a transformação das coordenadas do
mundo (em metros) para o sistema da imagem (pixels). Existem parâmetros intrínsecos
(internos à câmera) e extrínsecos (externos à câmera) e o cálculo desses parâmetros consiste
na calibração da câmera. Desse modo, a partir da imagem capturada de duas câmeras não
colineares, é possível determinar medidas de posição e tamanho de objetos no ambiente,
relacionando pixels correspondentes nas imagens das câmeras para as posições reais no
ambiente. Com todos esses dados é possível fazer uma correlação dos pixels nas duas fotos
tiradas das costas do paciente com o que elas representam na realidade, permitindo um
diagnóstico baseado nessas medidas (BRADSKI & KAEHLER, 2008).
A calibração da câmera é feita pela observação de um objeto que tem a geometria no
espaço 3D conhecida com alta precisão. Com base nas coordenadas previamente conhecidas
!21
de vários pontos de interesse no objeto de calibração, os parâmetros intrínsecos e extrínsecos
das câmeras são estimados com uma solução de mínimo erro quadrático.
4.1 – Modelo da câmera: pinhole
O modelo “Pinhole" é o modelo de câmera utilizado como referência nesse trabalho.
Pode ser traduzido livremente como buraco (hole) de alfinete (pin). Um “pinhole” éuma
parede imaginária com um pequeno orifício no centro, que bloqueia todos os raios de luz
exceto aquele que passa pelo pequeno orifício. Como mostra a Figura 4.1, baseia-se no
princípio da “câmera escura”, onde o Objeto 3D (5) tem sua projeção 2D (2) no plano da
imagem (1). No pequeno orifício (3), pinhole, é captada a luz para dentro da câmera e assim,
projetada a imagem. O mecanismo de projeção é semelhante ao olho humano, com orientação
contrária (DIAS, 2015).

Figura 4.1: Representação do modelo de câmera pinhole.
Fonte: DIAS, 2015.
Os principais elementos, conforme Figura 4.2, do modelo Pinhole são:
- Centro da Câmera: Assume-se que o centro da câmera é o pinhole (orifício);
- Plano Principal: Plano formado pelos eixos x e y posicionado ao centro da
câmera;
- Plano da Imagem: Plano que corresponde ao plano de formação da imagem;
- Eixo Principal: Formado pela reta que sai do centro da imagem [C] e passa
perpendicularmente pelo plano da imagem;
- Ponto Principal: Ponto onde intersecta o plano da imagem (não necessariamente corresponde
ao centro da imagem).
!22

Figura 4.2: Representação do sistema de coordenadas no modelo pinhole.
Fonte: DIAS, 2015.
Para relacionar coordenadas de um determinado ponto no espaço com sua projeção no
plano da imagem, pode-se utilizar trigonometria. Com o conhecimento da distância focal, ou
seja, a distância entre o ponto de convergência da luz até o ponto de projeção da imagem, é
possível calcular a projeção de um determinado ponto no espaço por semelhança de
triângulos. (KANNALA; BRANDT, 2004).
4.2 – Parâmetros intrínsecos
Os parâmetros intrínsecos são todos os parâmetros internos de uma câmera, tais como:
distância focal, ponto principal, distorção das lentes, etc (BRADSKI & KAEHLER, 2008).
Parâmetros intrínsecos são específicos para uma câmera. Eles incluem informações
como distância focal (fx, fy) e centros ópticos (cx, cy). A distância focal e os centros ópticos
são usados para criar uma matriz chamada de “matriz da câmera”, que pode ser usada para
remover a distorção devido às lentes de uma câmera específica. A matriz da câmera é
exclusiva para uma câmera específica, portanto, uma vez calculada, ela pode ser reutilizada
em outras imagens tiradas pela mesma câmera.
4.3 – Parâmetros extrínsecos
Os parâmetros extrínsecos são os parâmetros que representam a posição relativa da
câmera em relação ao sistema de coordenada do objeto. Fornecem informações da posição e
orientação da câmera em relação a um certo sistema de coordenadas global (ou do mundo).
!23
Em um sistema com mais de uma câmera, os parâmetros extrínsecos também descrevem a
relação entre as câmeras (BRADSKI & KAEHLER, 2008).
Para cada imagem que a câmera tira de um objeto, pode-se descrever a posição do
objeto em relação ao sistema de coordenadas da câmera em termos de rotação e translação
(Figura 4.3).

Figura 4.3: Convertendo da coordenada do objeto para a coordenada da câmera.
Fonte: Adaptada de BRADSKI & KAEHLER, 2008.
Dessa maneira, percebe-se que os parâmetros extrínsecos correspondem a vetores de
rotação e translação que traduzem coordenadas de um ponto 3D para um sistema de
coordenadas. O ponto Po no objeto é visto como ponto pc no plano da imagem; o ponto pc
está relacionado ao ponto Po aplicando uma matriz de rotação R e um vetor de translação T a
Po.
No mundo 3D, a câmera pode estar rotacionada nos três eixos (x, y e z) e possuir um
deslocamento em relação às coordenadas do objeto (BRADSKI & KAEHLER, 2008). As três
possíveis rotações estão representadas nas matrizes abaixo:

Define-se R sendo o produto de Rx, Ry e Rz e T como sendo o vetor de translação. O
vetor de translação é como se representa uma mudança de um sistema de coordenadas para
!24
outro sistema cuja origem é deslocada para outro local. Em outras palavras, o vetor de
translação é apenas o deslocamento da origem do primeiro sistema de coordenadas até a
origem do segundo sistema de coordenadas. Dessa forma, para mudar de um sistema de
coordenadas centralizado em um objeto para um centralizado na câmera, o vetor de translação
apropriado é simplesmente: T = origem do objeto - origem da câmera. Assim sendo, os
parâmetros extrínsecos podem ser modelados como E = (R|RT).
Existe uma transformação que relaciona os pontos tridimensionais com os respectivos
bidimensionais, exceto por distorções e erros mínimos. Equacionando essas relações com o
uso de equações lineares na variável de posição de um objeto, os coeficientes destas equações
tornam-se exatamente funções dos dados que a calibração determina. O processo de
calibração de câmera pode-se resumir a encontrar tais valores a partir de um conjunto de
pontos 3D e 2D correspondentes (BRADSKI & KAEHLER, 2008).
De um modo geral, o processo de calibração pode ser descrito da seguinte forma:
1. Determinar um conjunto de pontos no sistema de coordenadas do mundo e suas respectivas
projeções nas imagens;
2. Resolver as equações lineares;
3. Otimizar os dados obtidos, utilizando o resultado da etapa anterior como solução inicial.
4.4 – Distorções nas lentes
Para o processo de calibração, é necessário a captura de imagens da câmera. Essas
imagens estão sujeitas às distorções devido à imperfeição das lentes (umas mais, outras
menos), onde as retas do mundo real não são mais retas na imagem capturada. Esse nível de
imperfeição torna-se mais problemático nas lentes mais baratas, que possuem uma pequena
distância focal. Como o problema de calibração da câmera demanda de resultados precisos
para a maior confiabilidade do método, deve-se corrigir os problemas encontrados (DIAS,
2015).
Uma distorção pode ser entendida como um esticamento não uniforme da imagem,
onde o centro e as bordas são ampliados em proporções (formas) diferentes. Dois tipos
principais de distorção são a distorção radial e a distorção tangencial. A distorção radial faz
com que linhas retas pareçam curvas. Ela torna-se maior quanto mais longe do centro da
imagem forem os pontos, ou seja, evidencia-se nos cantos da imagem. De forma similar, a
!25
distorção tangencial ocorre porque a lente de captura de imagem não está alinhada
perfeitamente paralela ao plano de imagem. Portanto, algumas áreas da imagem podem
parecer mais próximas do que o esperado.

Figura 4.4: à esquerda, um objeto sem distorção e, à direita, o mesmo objeto com distorção radial.
Fonte: Autoria própria.
4.5 – Métodos de calibração
Para realizar a calibração, deve-se fornecer algumas imagens de amostra de um padrão
bem definido (por exemplo, um tabuleiro de xadrez). Encontram-se alguns pontos específicos
cujas posições relativas são conhecidas (por exemplo, cantos quadrados no tabuleiro de
xadrez). Conhecendo-se as coordenadas desses pontos no espaço do mundo real e sabendo as
coordenadas na imagem, pode-se descobrir os coeficientes de distorção. Para melhores
resultados, são necessárias, pelo menos, 10 imagens do padrão de teste. Pontos 3D são
chamados de pontos do objeto e pontos da imagem 2D são chamados de pontos da imagem.
Nesse projeto, foram cogitadas diferentes possibilidades: uma estrutura cúbica com
largura, altura e profundidade conhecidas, um plano com padrão xadrez (ZHANG, 2000) ou
um bastão rígido (BORGHESE, 2001) (nos dois últimos casos, a calibração envolve múltipla
aquisição de imagens dos objetos, em posições diferentes), visando o baixo custo e a
portabilidade, de modo a facilitar sua implementação em qualquer consultório médico ou
fisioterápico.
4.6 – Método escolhido
O procedimento de calibração das câmeras escolhido nesse projeto é realizado a partir
do método do plano com padrão xadrez. Nesse método, move-se um plano com padrão xadrez
dentro do volume de trabalho fazendo aquisição de múltiplas imagens. Após a detecção das
imagens do tabuleiro, são empregados algoritmos desenvolvidos com base nométodo de
!26
Zhengyou Zhang para detecção de pontos de interesse nas imagens e, com isso, extrair os
parâmetros intrínsecos, extrínsecos e de distorção das câmeras.
A técnica proposta por Zhang (2000) requer apenas a câmera observando um padrão
planar mostrado em, pelo menos, duas orientações diferentes. Essa abordagem utiliza
informações entre o plano da imagem (2D) e o mundo (3D), classificando-se como uma
técnica mais flexível, com configurações fáceis para que qualquer um possa fazer sua
calibração, avançando a visão computacional 3D dos ambientes de laboratório para o mundo
real.
Essa técnica é suficiente para um conjunto de duas câmeras paralelas e, além disso,
pode-se imprimir uma folha com o padrão xadrez facilmente em qualquer lugar. É uma forma
bem simples de realizar a calibração. Ponderaram-se sempre o baixo custo e a portabilidade,
de modo a facilitar sua implementação em qualquer consultório médico ou fisioterápico.
A técnica com o plano de padrão xadrez baseia-se em detectar todas as quinas de um
tabuleiro de xadrez em diversas fotos das duas câmeras para realizar a calibração. Move-se o
plano com padrão xadrez dentro do volume de trabalho fazendo aquisição de múltiplas
imagens. Essas imagens precisam ser diferentes entre si para que a calibração seja realizada
com sucesso e precisam conter todas as quinas do plano xadrez.
A calibração é importante também para relacionar as medições da câmera com
medições no mundo tridimensional real. A relação entre as unidades naturais da câmera
(pixels) e as unidades do mundo físico (por exemplo, metros) é um componente crítico em
qualquer tentativa de reconstruir uma cena tridimensional. A biblioteca OpenCV permite
realizar essa calibração com algumas de suas funções.
Para encontrar o padrão no tabuleiro de xadrez, pode-se utilizar a função
cv2.findChessboardCorners(). Também é necessário passar o tipo de padrão que está sendo
procurado, como grade 8x8, grade 5x5, etc. Nesse projeto, foi usada uma grade 9x6. A função
citada retorna os pontos em que foram encontrados os cantos e um valor “retval”, que é
verdadeiro se o padrão for obtido. Esses cantos são colocados em uma ordem (da esquerda
para a direita, de cima para baixo).
Uma vez encontrados os cantos, pode-se aumentar a precisão usando a função
cv2.cornerSubPix(). É possível também desenhar o padrão xadrez nas imagens usando a
função cv2.drawChessboardCorners().
!27
Uma imagem com o padrão xadrez encontrado é mostrada a seguir:

Figura 4.5: Imagem das câmeras esquerda e direita, com o padrão xadrez encontrado.
Fonte: Autoria própria.
Encontrados os pontos do objeto e os pontos da imagem, o sistema está pronto para a
calibração. Pode-se utilizar a função cv2.calibrateCamera(), que recebe os pontos do objeto,
os pontos da imagem e as dimensões da imagem, retornando a matriz da câmera (com os
parâmetros intrínsecos), coeficientes de distorção, vetores de rotação e translação e o erro
médio de reprojeção.
Essa função é utilizada duas vezes, visto que o sistema proposto é um sistema estéreo
com duas câmeras e a calibração apresentada até aqui é uma calibração simples, para uma
câmera apenas. Um modelo de calibração estéreo é apresentado mais à frente, mas ele requer
essa calibração simples inicialmente.
É possível calcular também o erro de reprojeção, que dá uma boa estimativa do quão
exatos são os parâmetros encontrados. Quanto mais próximo o erro de reprojeção estiver de
zero, mais precisos serão os parâmetros encontrados. Dadas as matrizes intrínsecas, de
distorção, de rotação e de translação, é preciso primeiramente transformar o ponto do objeto
em ponto da imagem usando a função cv2.projectPoints(). Com isso, é possível calcular a
norma absoluta entre o obtido com a transformação e o algoritmo de localização de canto.
Para encontrar o erro médio, calcula-se a média aritmética dos erros calculados para todas as
imagens de calibração.
!28
Capítulo 5
Sistema Estéreo
5.1 – Visão 3D
Inicialmente, duas ou mais imagens são capturadas no mesmo momento por diferentes
câmeras. São necessárias múltiplas imagens para reconstruir uma cena tridimensional e,
assim, reproduzir a visão estéreo. Em seguida, os objetos presentes em uma imagem são
combinados com os objetos correspondentes na outra imagem, e as diferenças são analisadas
para gerar informações de profundidade. Os efeitos de disparidade (triangulação) são
utilizados como um meio de calcular a distância dos objetos.
Depois de calibrar a câmera, é possível relacionar pontos do mundo físico com pontos
da imagem e, então, calcular em que local da imagem, em coordenadas de pixel, um ponto 3D
externo deve aparecer. Os pontos foram calibrados para ter as mesmas coordenadas de pixel
em suas respectivas imagens esquerda e direita (BRADSKI & KAEHLER, 2008).
5.2 – Imagem estéreo
Os computadores conseguem reproduzir uma imagem estéreo encontrando
correspondências entre os pontos vistos por uma câmera e os mesmos pontos vistos por outra
câmera. Com essas correspondências e uma separação conhecida entre as câmeras, é possível
calcular a localização 3D do ponto (BRADSKI & KAEHLER, 2008).
Na prática, a imagem estéreo usando duas câmeras envolve quatro etapas:
1. Remover matematicamente a distorção da lente radial e tangencial; isso é chamado de
"undistortion". As saídas dessa etapa são imagens não distorcidas.
2. Ajustar os ângulos e distâncias entre câmeras, processo chamado de retificação. As saídas
dessa etapa são imagens alinhadas por linha e retificadas.
3. Encontrar os mesmos recursos nas visões das câmeras esquerda e direita, um processo
conhecido como correspondência. A saída desta etapa é um mapa de disparidade, onde as
disparidades são as diferenças no plano da imagem do mesmo recurso visualizado nas
câmeras esquerda e direita.
!29
4. Conhecendo-se o arranjo geométrico das câmeras, então pode-se transformar o mapa de
disparidade em distâncias, por triangulação. Essa etapa é chamada de reprojeção e a saída
é um mapa de profundidade.
5.3 – Triangulação
Em um sistema estéreo perfeitamente não distorcido e alinhado (como mostrado na
Figura 5.1), têm-se duas câmeras cujos planos de imagem são exatamente coplanares um com
o outro, com eixos ópticos exatamente paralelos e que estão a uma distância conhecida à
parte, e com distâncias focais iguais fl = fr. O eixo óptico é o raio do centro de projeção O
através do ponto principal c, também conhecido como o raio principal. Além disso, supõe-se
que os pontos principais cx_left e cx_right tenham sido calibrados para ter as mesmas
coordenadas de pixel em suas respectivas imagens esquerda e direita. Um ponto principal é
onde o raio principal cruza o plano da imagem. O plano da imagem raramente é exatamente
alinhado com a lente e, desse modo, o centro da imagem quase nunca é exatamente alinhado
com o ponto principal (BRADSKI & KAEHLER, 2008).

Figura 5.1: Com um sistema estéreo perfeitamente alinhado e não distorcido e correspondência
conhecida, a profundidade Z pode ser encontrada por semelhança de triângulos; os raios principais das
câmeras começam nos centros de projeção Ol e Or e se estendem pelos pontos principais dos dois
planos de imagem em cl e cr.
Fonte: BRADSKI & KAEHLER, 2008.
!30
Supõe-se também que as imagens estejam alinhadas por linhas e que cada linha de
pixels de uma câmera esteja alinhada exatamente com a linha correspondente na outra câmera.
Também supõe-se que é possível encontrar um ponto P no mundo físico nas imagens
esquerda e direita em pl e pr, que terão as respectivas coordenadas horizontais xl e xr.
Neste caso simplificado, tomar xl e xr como posições horizontais dos pontos na
câmera esquerda e direita (respectivamente) permite mostrar que a profundidade é
inversamente proporcional à disparidade entre essas visões, onde a disparidade é definida
simplesmente