[pt] Reconstruir a informação 3D de uma cena é uma tarefa bastante comum
em Visão Computacional. Uma das técnicas mais utilizadas para realizar
esta tarefa é a correspondência por estéreo, que consiste basicamente
em, dadas duas imagens referentes a uma mesma cena vista de pontos
diferentes, determinar os pontos correspondentes entre essas duas imagens
e armazenar essa informação em um mapa de disparidades. Até hoje
diversos métodos foram propostos para resolver o problema de estéreo com
esforço computacional viável e mantendo a qualidade dos resultados. Essa,
entretanto, é uma tarefa bastante árdua e que difícilmente alcança resultados
precisos com pouco esforço computacional. Nesse âmbito, uma técnica que
tem sido muito estudada são os Cortes de Grafo (Graph Cuts), que almeja
resolver o problema de minimização de energia em tempo polinomial. Nesse
caso o problema de estéreo é mapeado como um problema de minimização
de energia e desta forma solucionado utilizando cortes de grafo. Neste
trabalho estudamos as técnicas de cortes de grafo mais recentes e eficientes e
propomos um método para a determinação de correspondências entre duas
imagens num contexto de multi-resolução, no qual uma pirâmide Gaussiana
para as imagens é construída e a técnica de cortes de grafo é aplicada
em níveis menores, otimizando a performance e obtendo resultados mais
precisos através da utilização do algoritmo de expansão-alfa. São revisadas as
técnicas de cortes de grafo e de multi-resolução e os resultados obtidos são
apresentados e avaliados em relação a métodos semelhantes. / [en] Reconstructing the 3D information of a scene is a common task in Computer
Vision. Stereo matching is one of the most investigated techniques used
to perform this task, which basically consists of, given two images of a
scene seen from different view points, determining corresponding pixels in
these two images and store this information in a disparity map. Several
methods have been proposed to solve the stereo problem keeping good
performance and giving good quality results. This is however a very arduos
task which hardly achieves precise results with low computational power. In
this context, the Graph Cuts method has been very much considered, which
aims to solve the energy minimization problem in polinomial time. In this
case the stereo problem can be modelled as an energy minimization problem
and, thus solved using the Graph Cuts technique. In this work we investigate
the most recent and efficient Graph Cuts methods and propose a method
for establishing the correspondences between two images in the context
of multi-resolution, in which a Gaussian pyramid for the input images is
built and the Graph Cuts methods is applied in coarser levels, optimizing
the performance and getting more precise results through the use of the
alfa-expansion algorithm. The Graph Cuts and multi-resolution techniques
are reviewed and the results of the proposed method are presented and
evaluated compared to similar methods.
Identifer | oai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:16430 |
Date | 05 October 2010 |
Creators | CARLOS VINICIUS SOUSA DE OLIVEIRA |
Contributors | MARCELO GATTASS |
Publisher | MAXWELL |
Source Sets | PUC Rio |
Language | Portuguese |
Detected Language | English |
Type | TEXTO |
Page generated in 0.1251 seconds