Global ETD Search

41	Description Sémantique des Humains présents dans des Images Vidéo Sharma, Gaurav 17 December 2012 (has links) (PDF) Dans cette thèse, nous nous intéressons à la description sémantique des personnes dans les images en termes (i) d'attributs sémantiques (sexe, âge), (ii) d'actions (court, saute) et d'expressions faciales (sourire). Tout d'abord, nous proposons une nouvelle représentation des images permettant d'exploiter l'information spatiale spécifique à chaque classe. La représentation standard, les pyramides spatiales, suppose que la distribution spatiale de l'information est (i) uniforme et (ii) la même pour toutes les tâches. Au contraire notre représentation se propose d'apprendre l'information spatiale discriminante pour une tâche spécifique. De plus, nous proposons un modèle qui adapte l'information spatiale à chaque image. Enfin, nous proposons un nouveau descripteur pour l'analyse des expressions faciales. Nous apprenons un partitionnement de l'espace des différences locales d'intensité à partir duquel nous calculons des statistiques d'ordre supérieur pour obtenir des descripteurs plus expressifs. Nous proposons également une nouvelle base de données de 9344 images de personnes collectées sur l'Internet avec les annotations sur 27 attributs sémantiques relatifs au sexe, à l'âge, à l'apparence et à la tenue vestimentaire des personnes. Nous validons les méthodes proposées sur notre base de données ainsi que sur des bases de données publiques pour la reconnaissance d'actions et la reconnaissance d'expressions. Nous donnons également nos résultats sur des bases de données pour la reconnaissance de scènes, le classement d'images d'objets et la reconnaissance de textures afin de montrer le caractère général de nos contributions. Vision par ordinateur Apprentissage automatique Illustrations images etc - - Interprétation Perception des visages
42	Enhanced image and video representation for visual recognition Jain, Mihir 09 April 2014 (has links) (PDF) L'objectif de cette thèse est d'améliorer les représentations des images et des vidéos dans le but d'obtenir une reconnaissance visuelle accrue, tant pour des entités spécifiques que pour des catégories plus génériques. Les contributions de cette thèse portent, pour l'essentiel, sur des méthodes de description du contenu visuel. Nous proposons des méthodes pour la recherche d'image par le contenu ou par des requêtes textuelles, ainsi que des méthodes pour la reconnaissance et la localisation d'action dans des vidéos. En recherche d'image, les contributions se fondent sur des méthodes à base de plongements de Hamming. Tout d'abord, une méthode de comparaison asymétrique vecteur-à-code est proposée pour améliorer la méthode originale, symétrique et utilisant une comparaison code-à-code. Une méthode de classification fondée sur l'appariement de descripteurs locaux est ensuite proposée. Elle s'appuie sur une classification opérée dans un espace de similarités associées au plongement de Hamming. En reconnaissance d'action, les contributions portent essentiellement sur des meilleures manières d'exploiter et de représenter le mouvement. Finalement, une méthode de localisation est proposée. Elle utilise une partition de la vidéo en super-voxels, qui permet d'effectuer un échantillonnage 2D+t de suites de boîtes englobantes autour de zones spatio-temporelles d'intérêt. Elle s'appuie en particulier sur un critère de similarité associé au mouvement. Toutes les méthodes proposées sont évaluées sur des jeux de données publics. Ces expériences montrent que les méthodes proposées dans cette thèse améliorent l'état de l'art au moment de leur publication. recherche d'image classification d'image reconnaissance d'action vision par ordinateur reconnaissance de formes
43	De la segmentation au moyen de graphes d'images de muscles striés squelettiques acquises par RMN Baudin, Pierre-Yves 23 May 2013 (has links) (PDF) La segmentation d'images anatomiques de muscles striés squelettiques acquises par résonance magnétique nucléaire (IRM) présente un grand intérêt pour l'étude des myopathies. Elle est souvent un préalable nécessaire pour l'étude les mécanismes d'une maladie, ou pour le suivi thérapeutique des patients. Cependant, le détourage manuel des muscles est un travail long et fastidieux, au point de freiner les recherches cliniques qui en dépendent. Il est donc nécessaire d'automatiser cette étape. Les méthodes de segmentation automatique se basent en général sur les différences d'aspect visuel des objets à séparer et sur une détection précise des contours ou de points de repère anatomiques pertinents. L'IRM du muscle ne permettant aucune de ces approches, la segmentation automatique représente un défi de taille pour les chercheurs. Dans ce rapport de thèse, nous présentons plusieurs méthodes de segmentation d'images de muscles, toutes en rapport avec l'algorithme dit du marcheur aléatoire (MA). L'algorithme du MA, qui utilise une représentation en graphe de l'image, est connu pour être robuste dans les cas où les contours des objets sont manquants ou incomplets et pour son optimisation numérique rapide et globale. Dans sa version initiale, l'utilisateur doit d'abord segmenter de petites portions de chaque région de l'image, appelées graines, avant de lancer l'algorithme pour compléter la segmentation. Notre première contribution au domaine est un algorithme permettant de générer et d'étiqueter automatiquement toutes les graines nécessaires à la segmentation. Cette approche utilise une formulation en champs aléatoires de Markov, intégrant une connaissance à priori de l'anatomie et une détection préalable des contours entre des paires de graines. Une deuxième contribution vise à incorporer directement la connaissance à priori de la forme des muscles à la méthode du MA. Cette approche conserve l'interprétation probabiliste de l'algorithme original, ce qui permet de générer une segmentation en résolvant numériquement un grand système linéaire creux. Nous proposons comme dernière contribution un cadre d'apprentissage pour l'estimation du jeu de paramètres optimaux régulant l'influence du terme de contraste de l'algorithme du MA ainsi que des différents modèles de connaissance à priori. La principale difficulté est que les données d'apprentissage ne sont pas entièrement supervisées. En effet, l'utilisateur ne peut fournir qu'une segmentation déterministe de l'image, et non une segmentation probabiliste comme en produit l'algorithme du MA. Cela nous amène à faire de la segmentation probabiliste optimale une variable latente, et ainsi à formuler le problème d'estimation sous forme d'une machine à vecteurs de support latents (latent SVM). Toutes les méthodes proposées sont testées et validées sur des volumes de muscles squelettiques acquis par IRM dans un cadre clinique. Vision par ordinateur Apprentissage automatique Traitement des images médicales
44	Modélisation Spatio-Temporelle des scènes dynamiques 3D à partir de données visuelles Varanasi, Kiran 02 December 2010 (has links) (PDF) Space-time models (or 4D models) are descriptions of dynamic activities of the real world, that can be stored, analyzed by computers and visualized at distance. Digital imaging and computing technologies of today have matured to a level capable of recording human activities in rich three dimensional detail, and across a length of time. Such photographic 4D models shall in the future be the equivalents of photographic video of today, and produce equivalent artifacts of human culture and heritage. In this thesis, we are concerned with the problem of building such space-time models from the bottoms up through a multi-camera environment. Our contributions are primarily towards estimating motion, both at a coarse and at a dense level from surfaces reconstructed in this fashion. vision par ordinateur modelisation 4D
45	Outils d'aide à la décision basés sur la simulation pour la logistique hospitalière, application à un nouvel hôpital Mebrek, Fateh 11 December 2008 (has links) (PDF) De nos jours les entreprises dans notre cas les systèmes hospitaliers, ont besoin de modéliser leur organisation, afin d'analyser leur fonctionnement, de détecter les dysfonctionnements et d'inventorier les flux internes et ceux échangés avec l'environnement. La modélisation étant un outil d'aide à la décision permettant d'éviter des investissements inconsidérés. Cette thèse décrit une modélisation et une simulation d'un hôpital moderne du système hospitalier français. Une méthodologie de modélisation ASCI (Analyse, Spécification, Conception et Implémentation) est utilisée pour ce système. Le processus de modélisation proposé fournit des modèles (modèle de connaissances, modèles d'action, modèles de résultats) dont l'évaluation permet de dimensionner le système et d'obtenir ses performances. Dans ce contexte s'inscrit ce travail de recherche, qui consiste à développer et utiliser la méthodologie de modélisation ASCI qui a été développé au sein du laboratoire LIMOS de Clermont-Ferrand pour la classe de systèmes de production et que nous adaptons aux systèmes hospitaliers. Hôpitaux Réorganisation Informatique
46	Système de vision hybride : modélisation et application au suivi haute résolution Badri, Julie 24 October 2008 (has links) (PDF) Cette thèse traite du suivi automatique de personne à travers la mise en oeuvre d'un système de vision hybride alliant un capteur ayant un grand champ de vue et une résolution faible avec un dispositif Pan-Tilt-Zoom orientable garantissant le détail de l'information. Une première partie est consacrée à la proposition d'une solution originale de calibrage lorsque les centres optiques des deux capteurs sont pratiquement confondus. Dans une seconde partie, nous abordons la mise en relation des informations extraites de chaque capteur et leur enrichissement mutuel nécessaire à la relation du suivi de personne basée sur une approche de filtrage particulaire : l'étape de prédiction du filtre est guidée par la détection issue de la caméra statique et la mesure est donnée par une modélisation d'apparence de la cible extraite de la caméra dynamique. Enfin, les premiers résultats de suivi sont présentés et analysés. Vision artificielle (robotique) Vision par ordinateur) Capteurs (technologie) ) Capteurs optiques) Caméras ) Étalonnage)
47	Paramétrisation et reconstruction des surfaces développables à partir d'images Perriollat, Mathieu 14 November 2008 (has links) (PDF) Cette thèse traite de la reconstruction 3D de scènes déformables à partir d'images. Nos méthodes s'appuient sur un modèle mathématique de la scène. La reconstruction consiste à estimer les paramètres du modèle grâce aux images. Plus particulièrement, nous nous intéressons aux objets déformables pouvant être représentés par des surfaces développables ou inextensibles. Les surfaces développables sont les surfaces régulières isométriques au plan. Notre première contribution est un modèle génératif de ces surfaces. Il se distingue des modèles existants par sa généralité et par l'expression explicite de la frontière de l'objet. Notre deuxième contribution est un algorithme permettant de reconstruire notre modèle à partir de plusieurs images synchronisées. Notre troisième contribution est une méthode de reconstruction des surfaces inextensibles. Elle exploite les contraintes liant les points de la surface pour trouver la surface 3D à partir d'une seule image et d'une déformation de référence. vision par ordinateur reconstruction 3D déformable surfaces inextensibles surfaces développables
48	Apprentissage a contrario et architecture efficace pour la détection d'évènements visuels significatifs Burrus, Nicolas 08 December 2008 (has links) (PDF) Pour assurer la robustesse d'un algorithme de détection, il est nécessaire de maîtriser son point de fonctionnement, et en particulier son taux de fausses alarmes. Cette tâche est particulièrement difficile en vision artificielle à cause de la grande variabilité des images naturelles, qui amène généralement à introduire des paramètres choisis a priori qui limitent la portée et la validité des algorithmes. Récemment, l'approche statistique a contrario a montré sa capacité à détecter des structures visuelles sans autre paramètre libre que le nombre moyen de fausses alarmes tolérées, en recherchant des entités dont certaines propriétés sont statistiquement trop improbables pour être le fruit du hasard. Les applications existantes reposent toutefois sur un cadre purement analytique qui requiert un travail important de modélisation, rend difficile l'utilisation de caractéristiques multiples et limite l'utilisation d'heuristiques de recherche dirigées par les données. Nous proposons dans cette thèse d'assouplir ces restrictions en ayant recours à de l'apprentissage pour les quantités non calculables analytiquement. Nous illustrons l'intérêt de la démarche à travers trois applications : la détection de segments, la segmentation en régions homogènes et la détection d'objets à partir d'une base de photos. Pour les deux premières applications, nous montrons que des seuils de détection robustes peuvent être appris à partir d'images de bruit blanc. Pour la dernière, nous montrons que quelques exemples d'images naturelles ne contenant pas d'objets de la base suffisent pour obtenir un algorithme de détection fiable. Enfin, nous remarquons que la monotonicité du raisonnement a contrario permet d'intégrer incrémentalement des informations partielles. Cette propriété nous conduit à proposer une architecture "anytime" pour la détection d'objets, c'est-à-dire capable de fournir des détections progressivement au cours de son exécution, en commençant par les objets les plus saillants. Vision par ordinateur Méthodes a contrario Apprentissage statistique Segmentation Reconnaissance d'objets
49	Modèle computationnel d'attention pour la vision adaptative / Computational attention model for adaptive vision Perreira da Silva, Matthieu 10 December 2010 (has links) L'analyse temps réel de la masse de données générée par les mécanismes de gestion de la vision dans les applications interactives est un problème toujours ouvert, promettant des avancées importantes dans des domaines aussi variés que la robotique, l’apprentissage à distance ou les nouvelles formes d’interactions avec l’utilisateur, sans clavier ni souris. Dans le cadre général de la vision, les algorithmes d’analyse de scène doivent trouver un compromis entre d'une part la qualité des résultats recherchés et d'autre part la quantité de ressources allouable aux différents tâches. Classiquement, ce choix est effectué à la conception du système (sous la forme de paramètres et d’algorithmes prédéfinis), mais cette solution limite le champ d’application de celui-ci. Une solution plus flexible consiste à utiliser un système de vision adaptatif qui pourra modifier sa stratégie d’analyse en fonction des informations disponibles concernant son contexte d’exécution. En conséquence, ce système doit posséder un mécanisme permettant de guider rapidement et efficacement l’exploration de la scène afin d’obtenir ces informations. Chez l’homme, les mécanismes de l’évolution ont mis en place le système d’attention visuelle. Ce système sélectionne les informations importantes afin de réduire la charge cognitive et les ambiguïtés d’interprétation de la scène. Nous proposons, dans cette thèse, un système d'attention visuelle, dont nous définissons l’architecture et les principes de fonctionnement. Ce dernier devra permettre l’interaction avec un système de vision afin qu’il adapte ses traitements en fonction de l’intérêt de chacun des éléments de la scène, i.e. ce que nous appelons saillance. A la croisée des chemins entre les modèles centralisés et hiérarchiques (ex : [Koch1985], puis [Itti1998]), et les modèles distribués et compétitifs (ex : [Desimone1995], puis [Deco2004, Rolls2006]), nous proposons un modèle hiérarchique, compétitif et non centralisé. Cette approche originale permet de générer un point de focalisation attentionnel à chaque pas de temps sans utiliser de carte de saillance ni de mécanisme explicite d’inhibition de retour. Ce nouveau modèle computationnel d'attention visuelle temps réel est basé sur un système d'équations proies / prédateurs, qui est bien adapté pour l'arbitrage entre un comportement attentionnel non déterministe et des propriétés de stabilité, reproductibilité, et réactivité. L'analyse des expérimentations menées est positive : malgré le comportement non-déterministe des équations proies / prédateurs, ce système possède des propriétés intéressantes de stabilité, reproductibilité, et réactivité, tout en permettant une exploration rapide et efficace de la scène. Ces propriétés ouvrent la possibilité d’aborder différents types d’applications allant de l’évaluation de la complexité d’images et de vidéos à la détection et au suivi d’objets. Enfin, bien qu’il soit destiné à la vision par ordinateur, nous comparons notre modèle au système attentionnel humain et montrons que celui-ci présente un comportement aussi plausible (voire plus en fonction du comportement défini) que les modèles classiques existants. / Providing real time analysis of the huge amount of data generated by computer vision algorithms in interactive applications is still an open problem. It promises great advances across a wide variety of fields : robotics, distance education, or new mouse-less and keyboard-less human computer interaction.When using scene analysis algorithms for computer vision, a trade-off must be found between the quality of the results expected, and the amount of computer resources allocated for each task. It is usually a design time decision, implemented through the choice of pre-defined algorithms and parameters. However, this way of doing limits the generality of the system. Using an adaptive vision system provides a more flexible solution as its analysis strategy can be changed according to the information available concerning the execution context. As a consequence, such a system requires some kind of guiding mechanism to explore the scene faster and more efficiently.In human, the mechanisms of evolution have generated the visual attention system which selects the most important information in order to reduce both cognitive load and scene understanding ambiguity.In this thesis, we propose a visual attention system tailored for interacting with a vision system (whose theoretical architecture is given) so that it adapts its processing according to the interest (or salience) of each element of the scene.Somewhere in between hierarchical salience based (ex: [Koch1985], then [Itti1998]) and competitive distributed (ex: [Desimone1995], then [Deco2004, Rolls2006]) models, we propose a hierarchical yet competitive and non salience based model. Our original approach allows the generation of attentional focus points without the need of neither saliency map nor explicit inhibition of return mechanism. This new real-time computational model is based on a preys / predators system. The use of this kind of dynamical system is justified by an adjustable trade-off between nondeterministic attentional behavior and properties of stability, reproducibility and reactiveness.Our experiments shows that despite the non deterministic behavior of preys / predators equations, the system exhibits interesting properties of stability, reproducibility and reactiveness while allowing a fast and efficient exploration of the scene. These properties are useful for addressing different kinds of applications, ranging from image complexity evaluation, to object detection and tracking. Finally, while it is designed for computer vision, we compare our model to human visual attention. We show that it is equally as plausible as existing models (or better, depending on its configuration). Attention visuelle Vision par ordinateur Adaptation Systèmes dynamiques Visual attention Computer vision Adaptation Dynamical systems
50	Reconstruction of the surface of the Sun from stereoscopic images Lazǎr, Vlad-Andrei January 2007 (has links) Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal. Vision par ordinateur Rectification Stéréoscopie Transparence Estimation de profondeurs multiples Soleil Physique solaire

Search results