Global ETD Search

101	Localisation et Cartographie Simultanées avec Vision Monoculaire Lemaire, Thomas 20 December 2006 (has links) (PDF) Cette thèse aborde le problème de localisation et cartographie simultanée pour un robot mobile. Lorsque le robot Évolue dans un environnement inconnu, il doit construire une carte au fur et mesure qu'il explore le monde, tout en se localisant dans celle-ci. De l'anglais \textit{Simultaneous Localisation And Mapping}, le SLAM est une brique essentielle de l'architecture d'un robot autonome. Plusieurs éléments sont nécessaire ‡ la résolution du SLAM, en particulier la perception de l'environnement permet d'observer les éléments de référence (appelés amers) qui constituent la carte. Ces travaux se focalisent sur l'utilisation de la vision artificielle comme moyen de percevoir l'environnement, ainsi la carte et la position du robot peuvent être estimées dans l'espace 3D complet. Les caméras numériques sont des capteurs bien adaptés aux systèmes embarqués et fournissent une information riche sur l'environnement. Mais une caméra ne permet pas de mesurer la distance aux objets, dont on n'obtient donc que des observations partielles. En particulier, ceci rend difficile l'ajout d'un nouvel amer dans la carte. Une méthode d'initialisation pour des amers de type point est proposée, elle s'appuie sur un mécanisme de génération puis de sélection d'hypothèses. Une architecture SLAM pour un robot terrestre est décrite dans son ensemble, en particulier une caméra panoramique est utilisée et permet de percevoir l'environnement sur 360 degrés. Cette architecture a été implémentée sur un robot de type ATRV. Une carte de points 3D est pertinente pour la localisation d'un robot, mais donne une information limitée sur la structure de l'environnement. Un algorithme permettant d'utiliser des segments de droite est proposé, et testé sur des données réelles Localisation d'un robot SLAM Vision par ordinateur
102	Stratégies de perception par vision active pour la reconstruction et l'exploration de scènes statiques Marchand, Eric 26 June 1996 (has links) (PDF) Ce travail apporte sa contribution au problème de la reconstruction et de l'exploration de scènes dans un contexte de vision active. À la base du processus de reconstruction, nous avons choisi une méthode qui consiste à contraindre les mouvements de la caméra de manière à obtenir une estimation précise et robuste de primitives géométriques paramétrables telles que les segments et les cylindres. À cet aspect {\em continu} du processus de reconstruction que constitue l'estimation des paramètres des primitives, il est nécessaire de définir des stratégies de reconstruction et d'exploration de la scène que l'on supposera composée de segments, polyèdres et cylindres. Cette reconstruction est de caractère {\em événementiel} et est pilotée par la découverte de nouvelles primitives dans l'image. L'approche que nous avons définie consiste à sélectionner automatiquement les informations images pertinentes puis à focaliser successivement la caméra sur les différentes primitives de la scène afin de les reconnaître et ensuite de les reconstruire. La première étape de l'exploration, qui inclut la reconstruction 3D, permet de reconstruire de manière incrémentale l'ensemble des primitives qui apparaissent dans le champ de vision de la caméra. Nous avons appelé cette phase {exploration locale car elle ne fait appel qu'à des informations disponibles localement. Elle repose sur une approche de prédiction~/~vérification d'hypothèses gérées à l'aide de réseaux Bayesiens. Cette approche permet d'obtenir une représentation de plus haut niveau des objets considérés tout en traitant les problèmes locaux d'occlusion. Par contre, quand toutes les primitives précédemment observées ont été reconstruites, une stratégie différente doit été mise en oeuvre afin de focaliser la caméra sur des zones de la scène n'ayant pas encore été observées. Cette étape d'exploration globale permet d'assurer la complétude de la reconstruction. Cette méthode repose sur l'optimisation par ICM multi-échelle d'une fonction de coût adéquatement modélisée qui prend en compte les obstacles de la scène. Finalement, les algorithmes développés ont été spécifiés et mis en \oe uvre par le langage synchrone \signal\ permettant de l'intégration au sein du même formalisme, \signal\ et \signalgti, de la dualité continu / événementiel inhérente à ce type d'algorithme. Les méthodes que nous avons développées ont été mises en oeuvre sur la cellule de vision robotique de l' Irisa. Elles permettent de reconstruire en temps réel de façon précise, robuste, complète et totalement autonome, un environnement 3D composé de plusieurs primitives. [INFO:INFO_RB] Computer Science/Robotics [INFO:INFO_RB] Informatique/Robotique vision par ordinateur robotique
103	Analyse de l'illumination et des propriétés de réflectance en utilisant des collections d'images Diaz melo, Mauricio 26 October 2011 (has links) (PDF) L'utilisation de collections d'images pour les applications de vision par ordinateur devient de plus en plus commune des nos jours. L'objectif principal de cette thèse est d'exploiter et d'extraire des informations importantes d'images de scènes d'extérieur a partir de ce type de collections : l'illumination présente au moment de la prise, les propriétés de reflectance des matériaux composant les objets dans la scène et les propriétés radiométriques des appareils photo utilisés. Pour atteindre notre objectif, cette thèse est composée de deux parties principales. Dans un premier temps nous allons réaliser une analyse de différentes représentations du ciel et une comparaison des images basée sur l'apparence de celui-ci. Une grande partie de l'information visuelle perçue dans les images d'extérieures est due a l'illumination en provenance du ciel. Ce facteur est représenté par les rayons du soleil réfléchis et réfractés dans l'atmosphère en créant une illumination globale de l'environnement. En même temps cet environnement détermine la façon de percevoir les objets du monde réel. Etant donné l'importance du ciel comme source d'illumination, nous formulons un processus générique en trois temps, segmentation, modélisation et comparaison des pixels du ciel, pour trouver des images similaires en se basant sur leurs apparences. Différentes méthodes sont adoptées dans les phases de modélisation et de comparaison. La performance des algorithmes est validée en trouvant des images similaires dans de grandes collections de photos. La deuxième partie de cette thèse consiste a exploiter l'information géométrique additionnelle pour en déduire les caractéristiques photométriques de la scène. A partir d'une structure 3D récupérée en utilisant des méthodes disponibles, nous analysons le processus de formation de l'image a partir de modèles simples, puis nous estimons les paramètres qui les régissent. Les collections de photos sont généralement capturées par différents appareils photos, d'où l'importance d'insister sur leur calibrage radiométrique. Notre formulation estime cet étalonnage pour tous les appareils photos en même temps, en utilisant une connaissance a priori sur l'espace des fonctions de réponse des caméras possibles. Nous proposons ensuite, un cadre d'estimation conjoint pour calculer une représentation de l'illumination globale dans chaque image, l'albedo de la surface qui compose la structure 3D et le calibrage radiométrique pour tous les appareils photos. Vision par Ordinateur Photométrie Mesure des couleurs Calibration du camera
104	Action Representation and Recognition Weinland, Daniel 20 October 2008 (has links) (PDF) La reconnaissance d'actions et d'activités humaines est un thème de recherche ambitieux en vision par ordinateur, avec d'importantes et nombreuses applications, notamment pour la vidéo surveillance et les environnements interactifs et intelligents. D'un point de vue computationel une action peut être définie comme une entité de dimension 4 dans le l'espace et le temps. Plusieurs représentations peuvent alors être envisagées qui diffèrent par les informations considérées, par exemple : la forme ou l'apparence, la représentation explicite ou implicite du déroulement d'une action - la dynamique, l'invariance du modèle au genre, taille et corpulence et l'invariance au point de vue qui permet d'apprendre et de reconnaître une action avec des configurations de caméras différentes. Dans cette thèse, nous étudions ces représentations et leurs impacts sur la reconnaissance d'actions. Nous nous intéressons en particulier à l'invariance des représentations, à la modélisation de la dynamique d'une action et à la manière de segmenter une action. Nos resultats démontrent que la reconnaissance d'actions simples, par exemple se lever ou courir, peut s'effectuer independamment de point de vue, des caractéristiques propres du corps observé et de la dynamique de l'action. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre reconnaissance d'actions humaines vision par ordinateur apprentissage autómatique
105	Contribution à la détection et à la reconnaissance d'objets dans les images Harzallah, Hedi 16 September 2011 (has links) (PDF) Cette thèse s'intéresse au problème de la reconnaissance d'objets dans les images vidéo et plus particulièrement à celui de leur localisation. Elle a été conduite dans le contexte d'une collaboration scientifique entre l'INRIA Rhône-Alpes et MBDA France. De ce fait, une attention particulière a été accordée à l'applicabilité des approches proposées aux images infra-rouges. La méthode de localisation proposée repose sur l'utilisation d'une fenêtre glissante incluant une cascade à deux étages qui, malgré sa simplicité, permet d'allier rapidité et précision. Le premier étage est un étage de filtrage rejetant la plupart des faux positifs au moyen d'un classifieur SVM linéaire. Le deuxième étage élimine les fausses détections laissées par le premier étage avec un classifieur SVM non-linéaire plus lent, mais plus performant. Les fenêtres sont représentées par des descripteurs HOG et Bag-of-words. La seconde contribution de la thèse réside dans une méthode permettant de combiner localisation d'objets et catégorisation d'images. Ceci permet, d'une part, de prendre en compte le contexte de l'image lors de la localisation des objets, et d'autre part de s'appuyer sur la structure géométrique des objets lors de la catégorisation des images. Cette méthode permet d'améliorer les performances pour les deux tâches et produit des détecteurs et classifieurs dont la performance dépasse celle de l'état de l'art. Finalement, nous nous penchons sur le problème de localisation de catégories d'objets similaires et proposons de décomposer la tâche de localisation d'objets en deux étapes. Une première étape de détection permet de trouver les objets sans déterminer leurs positions tandis qu'une seconde étape d'identification permet de prédire la catégorie de l'objet. Nous montrons que cela permet de limiter les confusions entre les classes, principal problème observé pour les catégories d'objets visuellement similaires. La thèse laisse une place importante à la validation expérimentale, conduites sur la base PASCAL VOC ainsi que sur des bases d'images spécifiquement réalisées pour la thèse. [MATH] Mathematics [MATH] Mathématiques Localisation d'objet Classification d'images Reconnaissance Apprentissage machine Vision par ordinateur
106	VOCUS a visual attention system for object detection and goal-directed search / Frintrop, Simone. January 1900 (has links) Thesis (Ph.D.)--University of Bonn, Germany. / Includes bibliographical references and index.
107	VOCUS a visual attention system for object detection and goal-directed search / Frintrop, Simone. January 1900 (has links) Thesis (Ph. D.)--University of Bonn, Germany. / Includes bibliographical references and index.
108	Estimation géométrique et appariement en modélisation automatique / Tarel, Jean-Philippe. January 1900 (has links) Th. doct.--Math. appl.--Paris 9, 1996. / Bibliogr. p. 209-221. Résumé. 1996 d'après la déclaration de dépôt légal.
109	Recalage rigide, non rigide et projectif d'images médicales tridimensionnelles / Feldmar, Jacques. January 1900 (has links) Th. doct.--Informatique--Palaiseau--Éc. polytech., 1995. / Bibliogr. p. 179-190. Résumé en français et en anglais. 1997 d'après la déclaration de dépôt légal.
110	Methods and tools for rapid and efficient parallel implementation of computer vision algorithms on embedded multiprocessors / Méthodes et outils pour l'implémentation rapide et efficace d'algorithmes de vision par ordinateur sur des multiprocesseurs embarqués Schwambach, Vítor 30 March 2016 (has links) Les applications de vision par ordinateur embarquées demandent une forte capacité decalcul et poussent le développement des systèmes multi- et many-cores spécifiques à l’application. Les choix au départ de la conception du système peuvent impacter sa performance parallèle finale – parmi lesquelles la granularité de la parallélisation, le nombre de processeurs et l’équilibre entre calculs et l’acheminement des données. L’impact de ces choix est difficile à estimer dans les phases initiales de conception et il y a peu d’outils et méthodes pour aider les concepteurs dans cette tâche. Les contributions de cette thèse consistent en deux méthodes et les outils associés qui visent à faciliter la sélection des paramètres architecturaux d’un multiprocesseur embarqué et les stratégies de parallélisation des applications de vision embarquée. La première est une méthode d’exploration de l’espace de conception qui repose sur Parana, un outil fournissant une estimation rapide et précise de la performance parallèle. Parana permet l’évaluation de différents scénarios de parallélisation et peut déterminer la limite maximale de performance atteignable. La seconde contribution est une méthode pour l’optimisation du dimensionnement des tuiles d’images 2D utilisant la programmation par contraintes dans l’outil Tilana. La méthode proposée intègre pour plus de précision des facteurs non-linéaires comme les temps des transferts DMA et les surcoûts de l’ordonnancement parallèle. / Embedded computer vision applications demand high system computational power and constitute one of the key drivers for application-specific multi- and many-core systems. A number of early system design choices can impact the system’s parallel performance – among which the parallel granularity, the number of processors and the balance between computation and communication. Their impact in the final system performance is difficult to assess in early design stages and there is a lack for tools that support designers in this task. The contributions of this thesis consist in two methods and associated tools that facilitate the selection of embedded multiprocessor’s architectural parameters and computer vision application parallelization strategies. The first consists of a Design Space Exploration (DSE) methodology that relies on Parana, a fast and accurate parallel performance estimation tool. Parana enables the evaluation of what-if parallelization scenarios and can determine their maximum achievable performance limits. The second contribution consists of a method for optimal 2D image tile sizing using constraint programming within the Tilana tool. The proposed method integrates non-linear DMA data transfer times and parallel scheduling overheads for increased accuracy. Architecture Vidéo Multiprocesseur Algorithme Analyse Vision par ordinateur Architecture Video Multiprocessor Algorithm Analysis Computer vision 004

Search results