Return to search

Stratégies de perception par vision active pour la reconstruction et l'exploration de scènes statiques

Ce travail apporte sa contribution au problème de la reconstruction et de l'exploration de scènes dans un contexte de vision active. À la base du processus de reconstruction, nous avons choisi une méthode qui consiste à contraindre les mouvements de la caméra de manière à obtenir une estimation précise et robuste de primitives géométriques paramétrables telles que les segments et les cylindres. À cet aspect {\em continu} du processus de reconstruction que constitue l'estimation des paramètres des primitives, il est nécessaire de définir des stratégies de reconstruction et d'exploration de la scène que l'on supposera composée de segments, polyèdres et cylindres. Cette reconstruction est de caractère {\em événementiel} et est pilotée par la découverte de nouvelles primitives dans l'image. L'approche que nous avons définie consiste à sélectionner automatiquement les informations images pertinentes puis à focaliser successivement la caméra sur les différentes primitives de la scène afin de les reconnaître et ensuite de les reconstruire. La première étape de l'exploration, qui inclut la reconstruction 3D, permet de reconstruire de manière incrémentale l'ensemble des primitives qui apparaissent dans le champ de vision de la caméra. Nous avons appelé cette phase {exploration locale car elle ne fait appel qu'à des informations disponibles localement. Elle repose sur une approche de prédiction~/~vérification d'hypothèses gérées à l'aide de réseaux Bayesiens. Cette approche permet d'obtenir une représentation de plus haut niveau des objets considérés tout en traitant les problèmes locaux d'occlusion. Par contre, quand toutes les primitives précédemment observées ont été reconstruites, une stratégie différente doit été mise en oeuvre afin de focaliser la caméra sur des zones de la scène n'ayant pas encore été observées. Cette étape d'exploration globale permet d'assurer la complétude de la reconstruction. Cette méthode repose sur l'optimisation par ICM multi-échelle d'une fonction de coût adéquatement modélisée qui prend en compte les obstacles de la scène. Finalement, les algorithmes développés ont été spécifiés et mis en \oe uvre par le langage synchrone \signal\ permettant de l'intégration au sein du même formalisme, \signal\ et \signalgti, de la dualité continu / événementiel inhérente à ce type d'algorithme. Les méthodes que nous avons développées ont été mises en oeuvre sur la cellule de vision robotique de l' Irisa. Elles permettent de reconstruire en temps réel de façon précise, robuste, complète et totalement autonome, un environnement 3D composé de plusieurs primitives.

Identiferoai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00843873
Date26 June 1996
CreatorsMarchand, Eric
PublisherUniversité Rennes 1
Source SetsCCSD theses-EN-ligne, France
Languagefra
Detected LanguageFrench
TypePhD thesis

Page generated in 0.0421 seconds