Return to search

Markov random field based methods for cluttered scene stereo

This thesis studies the performance of different Markov Random Field (MRF) based stereo formulations for cluttered scenes. Cluttered scenes have objects of a specific size distribution placed randomly in 3D space. Real-world examples of such scenes include forest canopy, bushes or foliages in general. One characteristic of such scenes is that they contain a lot of depth discontinuities and partially visible pixels. A natural question which is addressed in this thesis is how well the existing stereo algorithms perform for such scenes. The scenes used in some of the widely used benchmark dataset do not contain stereo pairs with dense clutter. Therefore, we use a cluttered scene model [1] to generate synthetic scenes with different scene parameters such as size and density of objects, and range of depth. In our experiments we apply algorithms with basic and visibility constraints. In the basic category we use: Expansion, Swap, Max Product Belief Propagation (BP-M), Sequential Tree Reweighted Message Passing (TRW-S) and Sequential Belief Propagation (BP-S) with different forms of data and smoothness terms. In the visibility constraint category we use: KZ1 and KZ2 proposed in [2, 3, 4]. The algorithms are applied to the input dataset with different parameter settings. To compare the performance, we consider the percentage of mislabeled pixels, errors in certain regions and the contribution of the errors in those regions to the total error. We also analyze the cause of those errors using the underlying scene statistics. For the basic formulation, Potts model performs surprisingly well in all the experiments, in the sense that binocularly visible surface points are correctly labeled. In particular, Expansion, TRW-S, and BP-M perform equally well. Algorithms with visibility constraints also perform equally well for binocular pixels and in some cases slightly better than basic formulation. We did not observe any clear improvement in labeling binocular pixels. However, vis / Ce mémoire vise à comparer la performance de différents modèles stéréo par champs aléatoires de Markov sur des scènes encombrées. Ces scènes sont composées d'objets dont les grandeurs suivent une distribution spécifique et dont les positions sont aléatoires dans l'espace 3D. Elles se caractérisent par la présence de plusieurs discontinuités de profondeur et d'occlusions partielles. Des buissons, des feuillages ou une forêt en sont des exemples. Les scènes de référence généralement utilisées ne contiennent pas d'images stéréo de scènes encombrées. Il nous apparaît donc important de vérifier la performance des algorithmes stéréo existants sur ce type de scènes. Par conéquent, nous utilisons un modèle de scènes encombrées pour générer des scènes synthétiques selon différents paramètres tels que la taille et la densité des objets, et l'intervalle des profondeurs. Nos tests appliquent des algorithmes avec contraintes de base et de visibilité. Parmi les algorithmes avec contraintes de base, nous utilisons: Expansion, Swap, Max Product Belief Propagation (BP-M), Sequential Tree Reweighted Message Passing (TRWS) et Sequential Belief Propagation (BP-S) avec différentes fonctions de coût et de lissage. Parmi les algorithmes avec contraintes de visiblité, nous utilisons: KZ1 et KZ2 proposés dans [2, 3, 4]. Les algorithmes sont appliqués aux images synthétiques avec différentes valeurs de paramètres. Pour comparer la performance, nous considérons dans toute l'image le pourcentage de pixels erronés, c'est-à-dire n'ayant pas la bonne étiquette de profondeur, ainsi que le pourcentage d'erreurs dans certaines régions et sa contribution dans l'erreur totale. Nous analysons la cause de ces erreurs à l'aide des statistiques de la scène. Pour les algorithmes avec contraintes de base, le modèle de Potts performe bien pour tous les tests, en ce sens que les points visibles dans les deux images (pixels binoculaires) sont asso

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.95177
Date January 2010
CreatorsMannan, Fahim
ContributorsMichael Langer (Internal/Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (School of Computer Science)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.031 seconds