Global ETD Search

31	Segmentation d'images par combinaison adaptative couleur-texture et classification de pixels. : Applications à la caractérisation de l'environnement de réception de signaux GNSS ATTIA, Dhouha 03 October 2013 (has links) (PDF) En segmentation d'images, les informations de couleur et de texture sont très utilisées. Le premier apport de cette thèse se situe au niveau de l'utilisation conjointe de ces deux sources d'informations. Nous proposons alors une méthode de combinaison couleur/texture, adaptative et non paramétrique, qui consiste à combiner un (ou plus) gradient couleur et un (ou plus) gradient texture pour ensuite générer un gradient structurel utilisé comme image de potentiel dans l'algorithme de croissance de régions par LPE. L'originalité de notre méthode réside dans l'étude de la dispersion d'un nuage de point 3D dans l'espace, en utilisant une étude comparative des valeurs propres obtenues par une analyse des composantes principales de la matrice de covariance de ce nuage de points. L'approche de combinaison couleur/texture proposée est d'abord testée sur deux bases d'images, à savoir la base générique d'images couleur de BERKELEY et la base d'images de texture VISTEX. Cette thèse s'inscrivant dans le cadre des projets ViLoc (RFC) et CAPLOC (PREDIT), le deuxième apport de celle-ci se situe au niveau de la caractérisation de l'environnement de réception des signaux GNSS pour améliorer le calcul de la position d'un mobile en milieu urbain. Dans ce cadre, nous proposons d'exclure certains satellites (NLOS dont les signaux sont reçus par réflexion voir totalement bloqués par les obstacles environnants) dans le calcul de la position d'un mobile. Deux approches de caractérisation, basées sur le traitement d'images, sont alors proposées. La première approche consiste à appliquer la méthode de combinaison couleur/texture proposée sur deux bases d'images réelles acquises en mobilité, à l'aide d'une caméra fisheye installée sur le toit du véhicule de laboratoire, suivie d'une classification binaire permettant d'obtenir les deux classes d'intérêt " ciel " (signaux LOS) et " non ciel " (signaux NLOS). Afin de satisfaire la contrainte temps réel exigée par le projet CAPLOC, nous avons proposé une deuxième approche basée sur une simplification de l'image couplée à une classification pixellaire adaptée. Le principe d'exclusion des satellites NLOS permet d'améliorer la précision de la position estimée, mais uniquement lorsque les satellites LOS (dont les signaux sont reçus de manière direct) sont géométriquement bien distribués dans l'espace. Dans le but de prendre en compte cette connaissance relative à la distribution des satellites, et par conséquent, améliorer la précision de localisation, nous avons proposé une nouvelle stratégie pour l'estimation de position, basée sur l'exclusion des satellites NLOS (identifiés par le traitement d'images), conditionnée par l'information DOP, contenue dans les trames GPS. Segmentation d'images Classification de pixels Couleur Texture Combinaison couleur/texture ACP Localisation GNSS Transport
32	Techniques visuelles pour la détection et le suivi d'objets 2D Sekkal, Rafiq 28 February 2014 (has links) (PDF) De nos jours, le traitement et l'analyse d'images trouvent leur application dans de nombreux domaines. Dans le cas de la navigation d'un robot mobile (fauteuil roulant) en milieu intérieur, l'extraction de repères visuels et leur suivi constituent une étape importante pour la réalisation de tâches robotiques (localisation, planification, etc.). En particulier, afin de réaliser une tâche de franchissement de portes, il est indispensable de détecter et suivre automatiquement toutes les portes qui existent dans l'environnement. La détection des portes n'est pas une tâche facile : la variation de l'état des portes (ouvertes ou fermées), leur apparence (de même couleur ou de couleur différentes des murs) et leur position par rapport à la caméra influe sur la robustesse du système. D'autre part, des tâches comme la détection des zones navigables ou l'évitement d'obstacles peuvent faire appel à des représentations enrichies par une sémantique adaptée afin d'interpréter le contenu de la scène. Pour cela, les techniques de segmentation permettent d'extraire des régions pseudo-sémantiques de l'image en fonction de plusieurs critères (couleur, gradient, texture...). En ajoutant la dimension temporelle, les régions sont alors suivies à travers des algorithmes de segmentation spatio-temporelle. Dans cette thèse, des contributions répondant aux besoins cités sont présentées. Tout d'abord, une technique de détection et de suivi de portes dans un environnement de type couloir est proposée : basée sur des descripteurs géométriques dédiés, la solution offre de bons résultats. Ensuite, une technique originale de segmentation multirésolution et hiérarchique permet d'extraire une représentation en régions pseudo-sémantique. Enfin, cette technique est étendue pour les séquences vidéo afin de permettre le suivi des régions à travers le suivi de leurs contours. La qualité des résultats est démontrée et s'applique notamment au cas de vidéos de couloir. Détection d'objets détection et suivi de portes extraction de descripteurs 2D segmentation d'images segmentation spatio-temporelle
33	Segmentation d'images ultrasonores basée sur des statistiques locales avec une sélection adaptative d'échelles Yang, Qing 15 March 2013 (has links) (PDF) La segmentation d'images est un domaine important dans le traitement d'images et un grand nombre d'approches différentes ent été développées pendant ces dernières décennies. L'approche des contours actifs est un des plus populaires. Dans ce cadre, cette thèse vise à développer des algorithmes robustes, qui peuvent segmenter des images avec des inhomogénéités d'intensité. Nous nous concentrons sur l'étude des énergies externes basées région dans le cadre des ensembles de niveaux. Précisément, nous abordons la difficulté de choisir l'échelle de la fenêtre spatiale qui définit la localité. Notre contribution principale est d'avoir proposé une échelle adaptative pour les méthodes de segmentation basées sur les statistiques locales. Nous utilisons l'approche d'Intersection des Intervalles de Confiance pour définir une échelle position-dépendante pour l'estimation des statistiques image. L'échelle est optimale dans le sens où elle donne le meilleur compromis entre le biais et la variance de l'approximation polynomiale locale de l'image observée conditionnellement à la segmentation actuelle. De plus, pour le model de segmentation basé sur une interprétation Bahésienne avec deux noyaux locaux, nous suggérons de considérer leurs valeurs séparément. Notre proposition donne une segmentation plus lisse avec moins de délocalisations que la méthode originale. Des expériences comparatives de notre proposition à d'autres méthodes de segmentation basées sur des statistiques locales sont effectuées. Les résultats quantitatifs réalisés sur des images ultrasonores de simulation, montrent que la méthode proposée est plus robuste au phénomène d'atténuation. Des expériences sur des images réelles montrent également l'utilité de notre approche. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Segmentation d'images Images ultrasonores Statistiques région locale Algorithmes robustes
34	Un nouvel a priori de formes pour les contours actifs / A new shape prior for active contour model Ahmed, Fareed 14 February 2014 (has links) Les contours actifs sont parmi les méthodes de segmentation d'images les plus utilisées et de nombreuses implémentations ont vu le jour durant ces 25 dernières années. Parmi elles, l'approche greedy est considérée comme l'une des plus rapides et des plus stables. Toutefois, quelle que soit l'implémentation choisie, les résultats de segmentation souffrent grandement en présence d'occlusions, de concavités ou de déformation anormales de la forme. Si l'on dispose d'informations a priori sur la forme recherchée, alors son incorporation à un modèle existant peut permettre d'améliorer très nettement les résultats de segmentation. Dans cette thèse, l'inclusion de ce type de contraintes de formes dans un modèle de contour actif explicite est proposée. Afin de garantir une invariance à la rotation, à la translation et au changement d'échelle, les descripteurs de Fourier sont utilisés. Contrairement à la plupart des méthodes existantes, qui comparent la forme de référence et le contour actif en cours d'évolution dans le domaine d'origine par le biais d'une transformation inverse, la méthode proposée ici réalise cette comparaison dans l'espace des descripteurs. Cela assure à notre approche un faible temps de calcul et lui permet d'être indépendante du nombre de points de contrôle choisis pour le contour actif. En revanche, cela induit un biais dans la phase des coefficients de Fourier, handicapant l'invariance à la rotation. Ce problème est résolu par un algorithme original. Les expérimentations indiquent clairement que l'utilisation de ce type de contrainte de forme améliore significativement les résultats de segmentation du modèle de contour actif utilisé. / Active contours are widely used for image segmentation. There are many implementations of active contours. The greedy algorithm is being regarded as one of the fastest and stable implementations. No matter which implementation is being employed, the segmentation results suffer greatly in the presence of occlusion, context noise, concavities or abnormal deformation of shape. If some prior knowledge about the shape of the object is available, then its addition to an existing model can greatly improve the segmentation results. In this thesis inclusion of such shape constraints for explicit active contours is being implemented. These shape priors are introduced through the use of robust Fourier based descriptors which makes them invariant to the translation, scaling and rotation factors and enables the deformable model to converge towards the prior shape even in the presence of occlusion and contextual noise. Unlike most existing methods which compare the reference shape and evolving contour in the spatial domain by applying the inverse transforms, our proposed method realizes such comparisons entirely in the descriptor space. This not only decreases the computational time but also allows our method to be independent of the number of control points chosen for the description of the active contour. This formulation however, may introduce certain anomalies in the phase of the descriptors which affects the rotation invariance. This problem has been solved by an original algorithm. Experimental results clearly indicate that the inclusion of these shape priors significantly improved the segmentation results of the active contour model being used. Contours actifs Modèles déformables A priori de formes Algorithme greedy Segmentation d'images Invariants Descripteurs de Fourier Active contours Deformable models Shape priors Greedy algorithm Image segmentation Invariants Fourier descriptors Snakes
35	Segmentation of 2D-echocardiographic sequences using level-set constrained with shape and motion priors / Segmentation de séquences échocardiographiques 2D par ensembles de niveaux contraints par a priori de forme et de mouvement Dietenbeck, Thomas 29 November 2012 (has links) L’objectif de cette thèse est de proposer un algorithme de segmentation et de suivi du myocarde basé sur le formalisme des ensembles de niveaux. Nous modélisons dans un premier temps le myocarde par un modèle géométrique (hyperquadriques) qui permet de représenter des formes asymétriques telles que le myocarde tout en évitant une étape d’apprentissage. Ce modèle est ensuite inclus dans le formalisme des ensembles de niveaux afin de servir de contrainte de forme lors de la segmentation simultanée de l’endocarde et de l’épicarde. Ce terme d’a priori de forme est couplé à un terme local d’attache aux données ainsi qu’à un terme évitant la fusion des deux contours. L’algorithme est validé sur 80 images en fin systole et en fin diastole segmentées par 3 cardiologues. Dans un deuxième temps, nous proposons de segmenter l’ensemble d’une séquence en utilisant l’information de mouvement. Dans ce but, nous faisons l’hypothèse de conservation des niveaux de la fonction implicite associée à l’ensemble de niveaux et l’exprimons comme une énergie dans un formalisme variationnel. Cette énergie est ensuite ajoutée à l’algorithme décrit précédemment pour la segmentation statique du myocarde afin de contraindre temporellement l’évolution du contour. L’algorithme est alors validé sur 20 séquences échocardiographiques (soit environ 1200 images) segmentées par 2 experts. / The aim of this work is to propose an algorithm to segment and track the myocardium using the level-set formalism. The myocardium is first approximated by a geometric model (hyperquadrics) which allows to handle asymetric shapes such as the myocardium while avoiding a learning step. This representation is then embedded into the level-set formalism as a shape prior for the joint segmentation of the endocardial and epicardial borders. This shape prior term is coupled with a local data attachment term and a thickness term that prevents both contours from merging. The algorithm is validated on a dataset of 80 images at end diastolic and end systolic phase with manual references from 3 cardiologists. In a second step, we propose to segment whole sequences using motion information. To this end, we apply a level conservation constraint on the implicit function associated to the level-set and express this contraint as an energy term in a variational framework. This energy is then added to the previously described algorithm in order to constrain the temporal evolution of the contour. Finally the algorithm is validated on 20 echocardiographic sequences with manual references of 2 experts (corresponding to approximately 1200 images). Imagerie médicale Imagerie cardiaque Echographie Image 2d Segmentation d'images Forme Mouvement Medical Imaging Cardiac Imaging Cardiac Modelling Echography 2D Imaging Segmentation Movement Segmentation 616.075 430 72
36	Estimation des déformations du ventricule gauche sur des séquences ciné-IRM non-marquées / Estimation of the deformations of the left ventricle on sequences movies-MRI non-marked Randrianarisolo, Solofohery 03 March 2009 (has links) Cette thèse présente un nouveau concept pour l’évaluation des déformations cardiaques à partir de ciné-IRM standard sans avoir recours aux images IRM marquées. Nous avons adapté la méthode des ensembles de niveaux afin de segmenter le myocarde et évalué le déplacement des contours endo et épicardique. Le processus de segmentation est appliqué directement sur un ensemble d’images pseudo-volumique 2D + t. Cela conduit à une méthode de segmentation efficace tenant compte à la fois des contraintes de continuité spatiale et temporelle. Puis, nous avons évalué le déplacement des contours endo et épicardique détectés avec une technique de mise en correspondance fondée sur les ensembles de niveaux. La vitesse de déplacement au sein de la paroi myocardique est évaluée par une méthode de flot optique, contrainte avec le déplacement des contours. Enfin, de ce champ de vitesses du myocarde, nous tirons des mesures pertinentes de la contraction cardiaque. La validation de la méthode proposée est effectuée sur des séquences d'images synthétiques, et en comparant sur les mêmes patients nos mesures à celles obtenues avec la méthode de référence HARP appliquée sur des images IRM taggées correspondantes. Les résultats de la méthode sont encourageants, ils sont pratiquement identiques à ceux de l’approche HARP. Cette méthode présente deux avantages principaux: premièrement elle exploite les ciné-IRM standard non taggées, deuxièmement elle permet des évaluations des déformations à haute résolution spatiale. Cette méthode est déjà disponible et peut rendre accessible l’évaluation des déformations du ventricule gauche du myocarde en routine clinique à partir des séquences ciné-IRM / This thesis presents a new concept for the assessment of cardiac deformation from standard cine-MRI without requiring tagged MRI. We have adapted the level set method to segment the myocardium and to evaluate the endocardial and epicardial velocity contours. The segmentation process is directly applied on a pseudo-volumic 2D+t set of images. This leads to an efficient segmentation method that both take into account spatial and temporal continuity constraints. Then, we evaluated the displacement of detected endocardial and epicardial contours by a levelset based matching procedure. The velocity flow in the myocardial wall is assessed by an optical flow method constrained with the contour displacement. Finally, from the velocity flow, we derive relevant measurements of the cardiac contraction. The validation of the method is performed on synthetic image sequences, and by comparing our measurements to those obtained on the same patients with the HARmonic Phase reference (HARP) method applied on matched tagged MR images. The results of this method are encouraging, they are practically identical to those HARP approach. This method presents two main advantages: first it exploits standard untagged cine-MRI, secondly it leads to high spatial resolution strain assessments. This method is readily available and has potential to make the assessment of left ventricular myocardial deformation accessible for clinical use from a set of cardiac cine MR acquisitions Traitement d'images Imagerie cardiaque IRM Evaluation des déformations Segmentation d'images Ensembles de niveaux Aide au diagnostic Images processing Cardiac imaging MRI Strain assessment Images segmentation Level sets Diagnosis
37	Reconnaissance automatique des gestes de la langue française parlée complétée Burger, Thomas 26 October 2007 (has links) (PDF) Le LPC est un complément à la lecture labiale qui facilite la communication des malentendants. Sur le principe, il s'agit d'effectuer des gestes avec une main placée à côté du visage pour désambigüiser le mouvement des lèvres, qui pris isolément est insuffisant à la compréhension parfaite du message. Le projet RNTS TELMA a pour objectif de mettre en place un terminal téléphonique permettant la communication des malentendants en s'appuyant sur le LPC. Parmi les nombreuses fonctionnalités que cela implique, il est nécessaire de pouvoir reconnaître le geste manuel du LPC et de lui associer un sens. L'objet de ce travail est la segmentation vidéo, l'analyse et la reconnaissance des gestes de codeur LPC en situation de communication. Cela fait appel à des techniques de segmentation d'images, de classification, d'interprétation de geste, et de fusion de données. Afin de résoudre ce problème de reconnaissance de gestes, nous avons proposé plusieurs algorithmes originaux, parmi lesquels (1) un algorithme basé sur la persistance rétinienne permettant la catégorisation des images de geste cible et des images de geste de transition, (2) une amélioration des méthodes de multi-classification par SVM ou par classifieurs unaires via la théorie de l'évidence, assortie d'une méthode de conversion des probabilités subjectives en fonction de croyance, et (3) une méthode de décision partielle basée sur la généralisation de la Transformée Pignistique, afin d'autoriser les incertitudes dans l'interprétation de gestes ambigus. Langue française Parlée Complétée code LPC reconnaissance de gestes vision par ordinateur segmentation d'images évaluation du mouvement rétine traitement vidéo classification SVM HMM fonctions de croyance Transformée Pignistique Partielle Langue des Signes Américaine fusion de modalités
38	Perfectionnement de métaheuristiques pour l'optimisation continue / Improvement of metaheuristics for continuous optimization Boussaid, Ilhem 29 June 2013 (has links) Les métaheuristiques sont des algorithmes génériques, souvent inspirés de la nature, conçues pour résoudre des problèmes d'optimisation complexes. Parmi les métaheuristiques les plus récentes, nous retenons celle basée sur la théorie de la biogéographie insulaire: Biogeography-based optimization (BBO).Dans cette thèse, nous considérons à la fois les problèmes d'optimisation globale à variables continues avec et sans contraintes. De nouvelles versions hybrides de BBO sont proposées comme des solutions très prometteuses pour résoudre les problèmes considérés. Les méthodes proposées visent à pallier les inconvénients de la convergence lente et du manque de diversité de l'algorithme BBO. Dans la première partie de cette thèse, nous présentons la méthode que nous avons développée, issue d'une hybridation de BBO avec l'évolution différentielle (DE) pour résoudre des problèmes d'optimisation sans contraintes. Nous montrons que les résultats de l'algorithme proposé sont plus précis, notamment pour des problèmes multimodaux, qui sont parmi les problèmes les plus difficiles pour de nombreux algorithmes d'optimisation. Pour résoudre des problèmes d'optimisation sous contraintes, nous proposons trois nouvelles variantes de BBO. Des expérimentations ont été menées pour rendre compte de l'utilité des méthodes proposées. Dans une deuxième partie, nous nous intéressons à l'étude des capacités des méthodes proposées à résoudre des problèmes d'optimisation, issus du monde réel. Nous nous proposons d'abord de résoudre le problème d'allocation optimale de puissance pour la détection décentralisée d'un signal déterministe dans un réseau de capteurs sans fil, compte tenu des fortes contraintes en ressources énergétiques et en bande passante des noeuds répartis. L'objectif est de minimiser la puissance totale allouée aux capteurs, tout en gardant la probabilité d'erreur de détection au dessous d'un seuil requis. Dans un deuxième temps, nous nous focalisons sur la segmentation d'images en niveaux de gris par seuillage multi-niveaux. Les seuils sont déterminés de manière à maximiser l'entropie floue. Ce problème d'optimisation est résolu en appliquant une variante de BBO (DBBO-Fuzzy) que nous avons développée. Nous montrons l'efficacité de la méthode proposée aux travers de résultats expérimentaux / Metaheuristics are general algorithmic frameworks, often nature-inspired, designed to solve complex optimization problems. Among representative metaheuristics, Biogeography-based optimization (BBO) has been recently proposed as a viable stochastic optimization algorithm. In this PhD thesis, both unconstrained and constrained global optimization problems in a continuous space are considered. New hybrid versions of BBO are proposed as promising solvers for the considered problems. The proposed methods aim to overcome the drawbacks of slow convergence and the lack of diversity of the BBO algorithm. In the first part of this thesis, we present the method we developed, based on an hybridization of BBO with the differential evolution (DE) algorithm, to solve unconstrained optimization problems. We show that the results of the proposed algorithm are more accurate, especially for multimodal problems, which are amongst the most difficult-to-handle class of problems for many optimization algorithms. To solve constrained optimization problems, we propose three new variations of BBO. Our extensive experimentations successfully demonstrate the usefulness of all these modifications proposed for the BBO algorithm. In the second part, we focus on the applications of the proposed algorithms to solve real-world optimization problems. We first address the problem of optimal power scheduling for the decentralized detection of a deterministic signal in a wireless sensor network, with power and bandwidth constrained distributed nodes. The objective is to minimize the total power spent by the whole sensor network while keeping the detection error probability below a required threshold. In a second time, image segmentation of gray-level images is performed by multilevel thresholding. The optimal thresholds for this purpose are found by maximizing the fuzzy entropy. The optimization is conducted by a newly-developed BBO variants (DBBO-Fuzzy). We show the efficiency of the proposed method through experimental results Optimisation continue Métaheuristiques Réseaux de capteurs sans fil Segmentation d'images Seuillage Continuous optimization Metaheuristics Biogeography Based Optimization (BBO) Wireless sensor network Image segmentation Thresholding
39	Segmentation d'images de façades de bâtiments acquises d'un point de vue terrestre / Ground-based building facade image segmentation Burochin, Jean-Pascal 02 May 2012 (has links) L'analyse de façades (détection, compréhension et reconstruction) à partir d'images acquises depuis la rue est aujourd'hui un thème de recherche très actif en photogrammétrie et en vision par ordinateur de part ses nombreuses applications industrielles. Cette thèse montre des avancées réalisées dans le domaine de la segmentation générique de grands volumes de ce type d'images, contenant une ou plusieurs zones de façades (entières ou tronquées).Ce type de données se caractérise par une complexité architecturale très riche ainsi que par des problèmes liés à l'éclairage et au point de vue d'acquisition. La généricité des traitements est un enjeu important. La contrainte principale est de n'introduire que le minimum d'a priori possible. Nous basons nos approches sur les propriétés d'alignements et de répétitivité des structures principales de la façade. Nous proposons un partitionnement hiérarchique des contours de l'image ainsi qu'une détection de grilles de structures répétitives par processus ponctuels marqués. Sur les résultats, la façade est séparée de ses voisines et de son environnement (rue, ciel). D'autre part, certains éléments comme les fenêtres, les balcons ou le fond de mur, sans être reconnus, sont extraits de manière cohérente. Le paramétrage s'effectue en une seule passe et s'applique à tous les styles d'architecture rencontrés. La problématique se situe en amont de nombreuses thématiques comme la séparation de façades, l'accroissement du niveau de détail de modèles urbains 3D générés à partir de photos aériennes ou satellitaires, la compression ou encore l'indexation à partir de primitives géométriques (regroupement de structures et espacements entre elles / Facade analysis (detection, understanding and field of reconstruction) in street level imagery is currently a very active field of research in photogrammetric computer vision due to its many applications. This thesis shows some progress made in the field of generic segmentation of a broad range of images that contain one or more facade areas (as a whole or in part).This kind of data is carecterized by a very rich and varied architectural complexity and by problems in lighting conditions and in the choice of a camera's point of view. Workflow genericity is an important issue. One significant constraint is to be as little biased as possible. The approches presented extract the main facade structures based on geometric properties such as alignment and repetitivity. We propose a hierarchic partition of the image contour edges and a detection of repetitive grid patterns based on marked point processes. The facade is set appart from its neighbooring façades and from its environment (the ground, the sky). Some elements such as windows, balconies or wall backgrounds, are extracted in a relevant way, without being recognized. The parameters regulation is done in one step and refers to all architectural styles encountered. The problem originates from most themes such as facade separation, the increase of level of details in 3D city models generated from aerial or satellite imagery, compression or indexation based on geometric primitives (structure grouping and space between them) Segmentation d'images de façades Point de vue terrestre Modèles élémentaires 2D Densité de contours Structures répétitives Processus ponctuel marqué Facade segmentation Street level imagery Elementary 2D models Coutour density Repetitive structures Marked Point Processes
40	A contribution to mouth structure segmentation in images towards automatic mouth gesture recognition / Une contribution à la segmentation structurale d’une image de la bouche par reconnaissance gestuelle automatique Gómez-Mendoza, Juan Bernardo 15 May 2012 (has links) Ce travail présente une nouvelle méthodologie pour la reconnaissance automatique des gestes de la bouche visant à l'élaboration d'IHM pour la commande d'endoscope. Cette méthodologie comprend des étapes communes à la plupart des systèmes de vision artificielle, comme le traitement d'image et la segmentation, ainsi qu'une méthode pour l'amélioration progressive de l'étiquetage obtenu grâce à la segmentation. Contrairement aux autres approches, la méthodologie est conçue pour fonctionner avec poses statiques, qui ne comprennent pas les mouvements de la tête. Beaucoup d'interêt est porté aux tâches de segmentation d'images, car cela s'est avéré être l'étape la plus importante dans la reconnaissance des gestes. En bref, les principales contributions de cette recherche sont les suivantes: La conception et la mise en oeuvre d'un algorithme de rafinement d'étiquettes qui dépend d'une première segmentation/pixel étiquetage et de deux paramétres corrélés. Le rafineur améliore la précision de la segmentation indiquée dans l'étiquetage de sortie pour les images de la bouche, il apporte également une amélioration acceptable lors de l'utilisation d'images naturelles. La définition de deux méthodes de segmentation pour les structures de la bouche dans les images; l'une fondée sur les propriétés de couleur des pixels, et l'autre sur des éléments de la texture locale, celles-ci se complétent pour obtenir une segmentation rapide et précise de la structure initiale. La palette de couleurs s'avére particuliérement importante dans la structure de séparation, tandis que la texture est excellente pour la séparation des couleurs de la bouche par rapport au fond. La dérivation d'une procédure basée sur la texture pour l'automatisation de la sélection des paramètres pour la technique de rafinement de segmentation discutée dans la première contribution. Une version améliorée de l'algorithme d'approximation bouche contour présentée dans l'ouvrage de Eveno et al. [1, 2], ce qui réduit le nombre d'itérations nécessaires pour la convergence et l'erreur d'approximation finale. La découverte de l'utilité de la composante de couleur CIE à statistiquement normalisée, dans la différenciation lévres et la langue de la peau, permettant l'utilisation des valeurs seuils constantes pour effectuer la comparaison. / This document presents a series of elements for approaching the task of segmenting mouth structures in facial images, particularly focused in frames from video sequences. Each stage is treated separately in different Chapters, starting from image pre-processing and going up to segmentation labeling post-processing, discussing the technique selection and development in every case. The methodological approach suggests the use of a color based pixel classification strategy as the basis of the mouth structure segmentation scheme, complemented by a smart pre-processing and a later label refinement. The main contribution of this work, along with the segmentation methodology itself, is based in the development of a color-independent label refinement technique. The technique, which is similar to a linear low pass filter in the segmentation labeling space followed by a nonlinear selection operation, improves the image labeling iteratively by filling small gaps and eliminating spurious regions resulting from a prior pixel classification stage. Results presented in this document suggest that the refiner is complementary to image pre-processing, hence achieving a cumulative effect in segmentation quality. At the end, the segmentation methodology comprised by input color transformation, preprocessing, pixel classification and label refinement, is put to test in the case of mouth gesture detection in images aimed to command three degrees of freedom of an endoscope holder. Imagerie médicale Endoscopie Reconnaissance de mouvement Vision artificielle Segmentation d'images Interface Homme Machine Mouvement de la bouche Mouvement des lèvres Medical Imaging Endoscopy Movement recognition Image segmentation Lips segmentation Gesture classification Human machine modelling Human face modeling 616.075 450 72

Search results