DESENVOLVIMENTO DE UMA PLATAFORMA COMPUTACIONAL PARA OBTENÇÃO DA FORMA 3D DE OBJECTOS USANDO TÉCNICAS DE VISÃO ACTIVA 1 Teresa Azevedo1, João Manuel R. S. Tavares1,2, Mário A. Vaz1,2 Instituto de Engenharia Mecânica e Gestão Industrial, Lab. Óptica e Mecânica Experimental Universidade do Porto, Faculdade de Engenharia, Dep. de Engenharia Mecânica e Gestão Industrial 2 Resumo Neste artigo pretende-se descrever uma plataforma computacional que está a ser desenvolvida para obter a forma 3D de objectos usando técnicas de Visão Activa. Assim, partindo-se de uma sequência de imagens não calibradas do objecto a reconstruir, usando a referida plataforma, pretende-se extrair o movimento da câmara utilizada, proceder à calibração da mesma, e obter a geometria 3D do objecto em causa. de objectos utilizando a metodologia usualmente designada por Reconstrução de Estruturas a partir do Movimento, que se insere no grupo das técnicas de Visão Activa (Pollefeys, 1998). Assim, de forma a conseguir tal objectivo, está a ser desenvolvida uma plataforma computacional na qual estão a ser integradas diversas funções disponibilizadas em várias bibliotecas de domínio público. 1- INTRODUÇÃO Em Visão Computacional são várias as técnicas sem contacto que, directa ou indirectamente, se podem utilizar para recuperar a geometria 3D de um objecto, a distância desse objecto a um determinado referencial ou a orientação local da sua superfície. Tendo em conta os princípios básicos utilizados, essas técnicas são normalmente divididas em passivas e activas (Fig. 1). As funções já integradas abrangem várias técnicas de Visão Activa: extracção e emparelhamento de pontos fortes (pontos característicos) entre imagens, cálculo da geometria epipolar, rectificação e emparelhamento denso. Estas técnicas são habitualmente usadas na obtenção da forma 3D de objectos a partir de sequências de imagens (Fig. 2). Fig. 1 - Divisão usual das técnicas sem contacto para obtenção de informação tridimensional de um objecto. O principal objectivo do trabalho inerente a este artigo é a obtenção de modelos 3D Fig. 2 - Sequência das operações consideradas para a reconstrução 3D de objectos usando Visão Activa. 1 Neste artigo, após uma breve descrição da plataforma em desenvolvimento, são apresentados alguns resultados experimentais e, no final, são enumeradas algumas conclusões e indicadas perspectivas de trabalho futuro. 2 - PLATAFORMA DE VISÃO ACTIVA A plataforma computacional está a ser desenvolvida usando a linguagem C++, com uma interface gráfica adequada para o utilizador. Actualmente a plataforma utiliza a biblioteca OpenCV, que implementa alguns dos algoritmos mais usuais no domínio da Visão Computacional, assim como as bibliotecas Peter’s Matlab Functions for Computer Vision and Image Analysis, Torr’s Matlab Toolkit, KLT, Projective Rectification without Epipolar Geometry e Depth Discontinuities by Pixel-to-Pixel Stereo (Azevedo, 2005) (as funções que integravam as bibliotecas originais em Matlab foram previamente convertidas para a linguagem C++). Fig. 3 - Em cada item do menu da plataforma, são apresentados os vários algoritmos disponíveis para cada técnica; em baixo, pode-se visualizar duas imagens resultantes da aplicação de um desses algoritmos. Para cada técnica de Visão Activa disponibilizada, o utilizador pode escolher o algoritmo que pretende usar (Fig. 3), assim como definir comodamente os seus parâmetros (Fig. 4). 3 - RESULTADOS EXPERIMENTAIS Os resultados experimentais obtidos são apresentados nesta sessão segundo a sequência descrita na Fig. 2. Para tal foi considerado um par de imagens estéreo, de dimensões 540 × 612 pixéis, capturadas usando uma câmara digital convencional. Fig. 4 - Exemplo de selecção dos parâmetros de um algoritmo disponível na plataforma computacional. Assim, nas figuras 5 a 8 são apresentados os resultados obtidos com um par de imagens de uma secretária, que ilustram as técnicas de Visão Activa integradas actualmente na plataforma: extracção de pontos fortes (Fig. 5), emparelhamento desses pontos entre imagens (Fig. 6), cálculo da geometria epipolar (Fig. 7) e rectificação (Fig. 8). Para a obtenção do mapa de disparidade (Fig. 9) foi utilizado um outro par de imagens estéreo previamente rectificadas. Fig. 5 - Resultado da extracção de pontos fortes encontrados numa das imagens do par estéreo. 2 4 - CONCLUSÕES E TRABALHO FUTURO Neste artigo foi descrita uma plataforma computacional que está a ser desenvolvida, com uma interface gráfica adequada, que permitir a aplicabilidade e a comparação de vários algoritmos desenvolvidos em domínio público para a reconstrução 3D de objectos. Em resumo, pode-se afirmar que os algoritmos já integrados na plataforma computacional obtêm bons resultados experimentais quando os objectos em causa apresentam características fortes (por exemplo, vértices). Assim, as próximas etapas deste trabalho, irão concentrar-se no sentido de melhorar os resultados obtidos quando os objectos apresentam formas contínuas e suaves. Fig. 6 - Resultado do emparelhamento dos pontos fortes, da Fig. 5, na outra imagem do par estéreo. Posteriormente, serão melhoradas as técnicas integradas de rectificação e emparelhamento denso, e consideradas técnicas de calibração da câmara usada, assim como de obtenção da pose e do movimento da mesma (Pollefeys, 2004). Fig. 7 - Linhas epipolares obtidas na primeira imagem do par, após determinação da geometria epipolar. Finalmente, pretende-se utilizar a plataforma computacional apresentada na reconstrução e caracterização de formas 3D anatómicas exteriores. REFERÊNCIAS Pollefeys, M., Koch, R., Vergauwen, M., e Gool, L. V., Flexible acquisition of 3D structure from motion, Proceedings IEEE workshop on Image and Multidimensional Digital Signal Processing, Alpbach, pp. 195-198, 1998. Fig. 8 - Resultado da rectificação de uma das imagens. Azevedo, T., Tavares, J. R. S. e Vaz, M. P. S., Obtenção da Forma 3D de Objectos usando Metodologias de Reconstrução de Estruturas a partir do Movimento, Congreso de Métodos Numéricos en Ingeniería, Granada, Espanha, 2005. Pollefeys, M., Gool, L. V., Vergauwen, M., Verbiest, F., Cornelis, K., Tops, J., e Koch, R., Visual modeling with a hand-held camera, International Journal of Computer Vision 59(3), pp. 207-232, 2004. Fig. 9 - Mapa de disparidade obtido utilizando duas imagens estéreo previamente rectificadas. 3