Spelling suggestions: "subject:"détection automatique"" "subject:"étection automatique""
1 |
3D dynamic facial sequences analysis for face recognition and emotion detection / Analyse de séquences faciales 3D pour la reconnaissance d’identité et la détection des émotionsAlashkar, Taleb 02 November 2015 (has links)
L’étude menée dans le cadre de cette thèse vise l’étude du rôle de la dynamique de formes faciales 3D à révéler l’identité des personnes et leurs états émotionnels. Pour se faire, nous avons proposé un cadre géométrique pour l’étude des formes faciales 3D et leurs dynamiques dans le temps. Une séquence 3D est d’abord divisée en courtes sous-séquences, puis chacune des sous-séquences obtenues est représentée dans une variété de Grassmann (ensemble des sous-espaces linéaires de dimension fixe). Nous avons exploité la géométrie de ces variétés pour comparer des sous-séquences 3D, calculer des statistiques (telles que des moyennes) et quantifier la divergence entre des éléments d’une même variété Grassmannienne. Nous avons aussi proposé deux représentations possibles pour les deux applications cibles – (1) la première est basée sur les dictionnaires (de sous-espaces) associée à des techniques de Dictionary Learning Sparse Coding pour la reconnaissance d’identité et (2) le représentation par des trajectoires paramétrées par le temps sur les Grassmanniennes couplée avec une variante de l’algorithme de classification SVM, permettant un apprentissage avec des données partielles, pour la détection précoce des émotions spontanée. Les expérimentations réalisées sur les bases publiques BU-4DFE, Cam3D et BP4D-Spontaneous montrent à la fois l’intérêt du cadre géométrique proposé (en terme de temps de calcul et de robustesse au bruit et aux données manquantes) et les représentations adoptées (dictionnaires pour la reconnaissance d’identité et trajectoires pour la détection précoce des émotions spontanées). / In this thesis, we have investigated the problems of identity recognition and emotion detection from facial 3D shapes animations (called 4D faces). In particular, we have studied the role of facial (shapes) dynamics in revealing the human identity and their exhibited spontaneous emotion. To this end, we have adopted a comprehensive geometric framework for the purpose of analyzing 3D faces and their dynamics across time. That is, a sequence of 3D faces is first split to an indexed collection of short-term sub-sequences that are represented as matrix (subspace) which define a special matrix manifold called, Grassmann manifold (set of k-dimensional linear subspaces). The geometry of the underlying space is used to effectively compare the 3D sub-sequences, compute statistical summaries (e.g. sample mean, etc.) and quantify densely the divergence between subspaces. Two different representations have been proposed to address the problems of face recognition and emotion detection. They are respectively (1) a dictionary (of subspaces) representation associated to Dictionary Learning and Sparse Coding techniques and (2) a time-parameterized curve (trajectory) representation on the underlying space associated with the Structured-Output SVM classifier for early emotion detection. Experimental evaluations conducted on publicly available BU-4DFE, BU4D-Spontaneous and Cam3D Kinect datasets illustrate the effectiveness of these representations and the algorithmic solutions for identity recognition and emotion detection proposed in this thesis.
|
2 |
Apprentissage à base de gradient pour l'extraction de caractéristiques dans les signaux sonores complexesLacoste, Alexandre January 2006 (has links)
Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.
|
3 |
Recalage automatique de modèles 3D d'arcades dentaires à partir de photographiesDestrez, Raphaël 13 December 2013 (has links) (PDF)
En orthodontie, le diagnostic et la planification d'un traitement reposent sur la connaissance de l'architecture dentaire du patient relevée, entre autre, par un moulage en plâtre. Aujourd'hui, des logiciels permettent de manipuler des modèles numériques des arcades dentaires obtenus après numérisation des moulages. Afin d'observer l'engrènement des dents, il est nécessaire de mettre en occlusion les deux arcades numérisées séparément. Cette étape est actuellement manuelle et l'objet de ces travaux de thèse est de proposer une chaîne robuste de traitements permettant un recalage automatique des deux arcades guidé par plusieurs photos "en bouche" du patient. L'approche proposée consiste à définir trois types de points singuliers et à mettre en place des méthodes robustes de détection automatique à la fois sur les modèles 3D et les images couleur s'appuyant sur la courbure et la texture. Une fois mis en correspondance, ces points homologues 2D/3D permettent d'estimer les matrices de projection puis la transformation rigide (6ddl) pour positionner au mieux la mandibule par rapport au maxillaire en minimisant les erreurs de reprojection dans plusieurs vues. Afin de s'affranchir du bruit de détection, les positions 2D et/ou 3D des points sont améliorées au cours du processus d'optimisation. De nombreux tests sur des données virtuelles et réelles valident l'approche choisie. L'occlusion finale obtenue par recalage automatique est proche de la référence de l'expert. Les résultats sont encourageants pour fournir une alternative automatique à intégrer dans un outil d'aide au diagnostic.
|
4 |
Recalage automatique de modèles 3D d'arcades dentaires à partir de photographies / Automatic registration of 3D dental models from photographsDestrez, Raphaël 13 December 2013 (has links)
En orthodontie, le diagnostic et la planification d'un traitement reposent sur la connaissance de l'architecture dentaire du patient relevée, entre autre, par un moulage en plâtre. Aujourd’hui, des logiciels permettent de manipuler des modèles numériques des arcades dentaires obtenus après numérisation des moulages. Afin d’observer l’engrènement des dents, il est nécessaire de mettre en occlusion les deux arcades numérisées séparément. Cette étape est actuellement manuelle et l’objet de ces travaux de thèse est de proposer une chaîne robuste de traitements permettant un recalage automatique des deux arcades guidé par plusieurs photos "en bouche" du patient. L'approche proposée consiste à définir trois types de points singuliers et à mettre en place des méthodes robustes de détection automatique à la fois sur les modèles 3D et les images couleur s’appuyant sur la courbure et la texture. Une fois mis en correspondance, ces points homologues 2D/3D permettent d'estimer les matrices de projection puis la transformation rigide (6ddl) pour positionner au mieux la mandibule par rapport au maxillaire en minimisant les erreurs de reprojection dans plusieurs vues. Afin de s’affranchir du bruit de détection, les positions 2D et/ou 3D des points sont améliorées au cours du processus d’optimisation. De nombreux tests sur des données virtuelles et réelles valident l'approche choisie. L’occlusion finale obtenue par recalage automatique est proche de la référence de l’expert. Les résultats sont encourageants pour fournir une alternative automatique à intégrer dans un outil d'aide au diagnostic. / In orthodontics, the diagnosis and the planning of a treatment rest on the knowledge of the dental architecture of the patient using, among others, a dental cast in plaster. Today, dedicated software allow to manipulate digital models of the dental arches obtained after digitalization of the casts. To observe the contact of teeth, it is necessary to register both arches scanned separately. This stage is at present manual and the object of this thesis research is to propose a robust chain processing allowing an automatic registration of both arches guided by several photos of the patient mouth. The proposed approach consists in defining three types of singular points and in setting up strong methods of automatic detection at the same time on the 3D models and the color images leaning on the curvature and the texture. Once put in correspondence, these 2D / 3D equivalent points allow to estimate the projection matrices then the rigid transformation (6ddl) to position at best the mandible in relation to the maxillary by minimizing the reprojection errors in several views. To free itself from the noise of detection, the 2D and/or 3D positions of the singular points are improved during the optimization process. Numerous tests on virtual and real data validate the proposed approach. The final occlusion obtained on the real data by automatic registration is close to the reference of the expert. These are encouraging results to supply an automatic alternative to be integrated into a help tool for the diagnosis.
|
5 |
001_correct : un environnement de restructuration des programmes objets piloté par la qualitéChawiche, Hassan M. January 2002 (has links)
Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.
|
6 |
Adaptation d'un algorithme de deuxième ordre pour la détection de pulse sans information de quadrature par le principe du temps de volEast-Lavoie, Simon 24 April 2018 (has links)
Par le principe du temps vol, un système émettant un pulse peut mesurer à quelle distance se trouve des cibles en calculant les délais d'arrivée des échos retournés par les obstacles. Des situations de détection complexes doivent être résolues, telles que deux cibles dont les échos se superposent partiellement. L'algorithme de détection développé a donc pour objectif de distinguer des cibles rapprochées entre elles, de façon fiable et précise, avec une bonne immunité au bruit, sur des signaux exclusivement réels, où seule l'information sur l'amplitude de l'enveloppe du signal est disponible. L'algorithme développé sera basé sur l'algorithme MUSIC. Ce dernier est inutilisable tel quel, dû à la nature des signaux. Une adaptation est tout d'abord élaborée, puis optimisée. Cette version de l'algorithme surpasse les performances des algorithmes de notre partenaire industriel et des méthodes de détection généralement employées et est en mesure de distinguer les échos de cibles rapprochées entre elles. / By using the time-of-flight principle, a system emitting a pulse is able to measure the distance of a target by calculating the echoes' delays returned by the obstacles. Some complex detection situations must be solved, such as two targets producing overlapping echoes. The goal of the detection algorithm is to distinguish targets with overlapping echoes, with a good precision and a good immunity to noise, using real signals, which only the enveloppe's amplitude information is available. The created algorithm is based on the MUSIC algorithm. The later is not working as it is, because of the signals' properties. An adaptation is created, and then optimized. The most substantial improvement comes from the decorrelation processing applied on the signals' covariance matrix. The effect is a decorrelation of the sources, allowing the algorithm to distinguish targets with overlapping echoes. Also, most of the decorrelation techniques help to detect echoes with low SNRs. Another improvement concerns the measurement resolution, which is better than just the sample period. The algorithm's performances exceed those of our industrial partner algorithms and those of commonly used detection methods. The ultimate goal of the project is to integrate the developped algorithm into our industrial partner's system. It has to be real time application, and to respect the cost and ressources constaints of the system. Consequently, some optimizations of the algorithm were required. Some specific properties of the covariance matrix allowed a decrease of the memory space to save its data. This way, the number of matrix's data saved represents less than 5% of the initial covariance matrix. Another optimization is done by using an iterative method for the eigenvalue decomposition, accelerating significantly the processing time. Finally, the algorithm 'sperformances coming out of the comparative tests completed between the adapted MUSIC algorithm and our industrial partner's algorithms demonstrate that the project's goals are fullfilled. The developped algorithm can solve the situation where two targets produce overlapping echoes, while providing a good noise immunity.
|
7 |
Apports de nouveaux outils de traitement d'images et de programmation pour le relevé automatique de dégradations sur chaussées / Contribution of new image processing and programming tools for automatic pavement degradations detectionKaddah, Wissam 19 December 2018 (has links)
Le réseau routier subit des dégradations sous l’effet du trafic et des conditions climatiques. Le relevé dans les images de différents types de défauts de surface permet d’évaluer l’état du réseau et de programmer des opérations de maintenance nécessaires. Le but de cette thèse est ainsi de développer des méthodes non-supervisées dédiées à l'analyse des images 2D et 3D. Nous nous focalisons sur la détection de dégradations du marquage routier et la détection des fissures sur la chaussée. Dans le cadre de la signalisation horizontale, notre objectif est de réaliser un algorithme capable de détecter, reconnaitre, géolocaliser et quantifier l’état du marquage routier à l’aide d’un système d’imagerie panoramique. Le traitement d’images effectué utilise une méthode de segmentation couleur pour faciliter la phase d’extraction des zones de marquages routiers. Ensuite, une technique de perspective inverse est appliquée pour faciliter l’identification des objets détectés. L’état du marquage est établi à partir des variations des caractéristiques géométriques (longueur, largeur, etc.) et colorimétriques (niveau de couleur blanche) des objets identifiés dans l’image. Dans le cadre de la détection des fissures, notre aspiration consiste à extraire automatiquement les fissures en surface de chaussée, en supposant que celles-ci sont des structures fines et sombres dans l’image. Parmi les nombreuses méthodes existantes, nos approches retenues suivent un schéma classique composé de trois phases principales, à savoir une phase de pré-traitement pour réduire la quantité d’information à traiter, une phase de traitement pour extraire les points ayant une forte vraisemblance d’appartenir à une fissure et une phase de post-traitement pour estimer la gravité du matériel. Les performances de nos algorithmes sont évaluées sur des images réelles 2D et 3D issues de 3 capteurs différents (VIAPIX®, LCMS et Aigle-RN). / The road network is subject to degradations due to traffic and weather conditions. The detection of surface defects within pavement images is used to evaluate the road network and to schedule the necessary maintenance operations. The goal of this thesis is to develop unsupervised processing techniques for the analysis of 2D and 3D pavement images, which originate from imaging systems operating in the field of road engineering. We focus on the detection of road marking damage and the detection of cracks on the pavement. In the context of road marking, our objective is to realize an algorithm for detecting, recognizing, geo-locating and monitoring the wearing conditions of road marking using a panoramic imaging system. The performed image processing uses a color segmentation method to facilitate the extraction phase of the road marking zones. Then, an inverse perspective technique is applied to ease the identification of detected objects.The wearing conditions of road marking is established from the variations in the geometric (length, width, etc.) and colorimetric (white color level) characteristics of the objects identified in the image.In the context of road crack detection, our aspiration is the automatic segmentation of cracks within pavement images, assuming that they represent fine and dark features in the image. Among the many existing methods, our chosen approaches follow a classical scheme composed of three main phases, namely, a pre-processing phase to reduce the amount of information to be processed in the image, a processing phase to extract the points having a high likelihood of belonging to a crack on the road and a post-processing phase to estimate the severity and the damage level of the pavement. The performances of our proposed algorithms are evaluated on 2D and 3D real images, coming from 3 types of existing imaging devices for road engineering (VIAPIX®, LCMS and Aigle-RN).
|
8 |
Typologie, architecture et origine des structures d'émission de fluides et leurs interactions avec les processus sédimentaires et tectoniques. Exemple de la Méditerranée Orientale / Typology, architecture and origin of fluid emission structures and their interactions with sedimentary and tectonic processes. Example of the Eastern MediterraneanMary, Flore 08 June 2018 (has links)
Depuis le début des années 80, les progrès technologiques de l'imagerie des fonds marins et l'exploration des marges continentales ont permis de découvrir et d'étudier de nombreuses morphologies du fond marin témoignant de la circulation des fluides dans la colonne sédimentaire et de leur expulsion. Dans cette étude des volcans de boue, nous proposons une méthode d'analyse innovante combinant une approche statistique automatisée incluant la détection et l'analyse de paramètres morphométriques avec une étude géologique classique. Nous avons utilisé un vaste jeu de données de géophysiques marines et géologiques, d’origines académiques et industrielles, à l’échelle du bassin oriental de la mer Méditerranée.Il ressort de cette analyse que le mécanisme de formation des volcans de boue est directement lié à une contrainte locale ou régionale pouvant avoir une origine tectonique ou gravitaire.Différents paramètres géologiques conditionnant les dimensions et formes des volcans de boue ont été étudiés permettant de proposer un modèle original de leur formation. La conception de ce modèle, qui se veut générique, permet de regrouper les paramètres constitutifs d’un système de volcan de boue en trois étapes spatiales, depuis la couche source jusqu’à l’expression superficielle. / Since the early 80s, technological advances of seabed imagery and exploration of continental margins allowed to discover and study numerous seabed features recording fluid circulation within the sediment column.In this study of mud volcanoes, we propose an innovative method of analysis combining an automated statistical approach including detection and analysis of morphometric parameters together with a classical geological study. We used broad homogenous academic and industrial marine geophysical and geological dataset, at the scale of Eastern Mediterranean sea.The analysis of these parameters shows that the mechanism of formation of the mud volcanoes is directly related to a local or regional constrain that may have a tectonic or gravitational origin.Various geological parameters conditioning the size and shape of mud volcanoes have been studied and lead to propose an original model for the formation of mud volcanoes. The design of this model, which is intended to be generic, makes it possible to group the constituent parameters of a mud volcano system in three spatial stages, from the source layer to the superficial expression.
|
9 |
Détection et analyse non destructive de caractéristiques internes de billons d'Epicéa commun (Picea abies (L.) Karst.) par tomographie à rayons XLonguetaud, Fleur 10 1900 (has links) (PDF)
La tomographie par rayons X permet un accès direct aux caractéristiques internes des billons scannés par l'intermédiaire des variations de densité et de teneur en eau. L'objectif de ce travail est de démontrer la faisabilité de la détection automatique de caractéristiques dans des billons à des fins d'analyses scientifiques. Nous disposons pour cela d'une base d'images tomographiques de 24 épicéas communs (Picea abies (L.) Karst.) obtenues avec un scanner médical. Les arbres sont représentatifs de différents statuts sociaux et proviennent de quatre peuplements du nord-est de la France, eux-mêmes sont représentatifs de plusieurs classes d'âge, de densité et de fertilité. Les procédures de détection développées sont les suivantes : - détection de la moelle dans les billons, y compris en présence de nœuds et/ou d'excentricité des cernes. La précision de la localisation est inférieure au millimètre ; - détection de la limite aubier/duramen dans les billons, y compris en présence des nœuds (principale source de difficulté). L'erreur sur le diamètre du duramen est de 1.8mm soit une erreur relative de 1.3%. ; - détection de la localisation des verticilles et une comparaison à une méthode optique ; - détection des nœuds individualisés. Cette procédure permet de compter les nœuds dans un billon et de les localiser (hauteur dans le billon et azimut); cependant, la validation de la méthode et l'extraction du diamètre et de l'inclinaison des branches reste à effectuer. Une application de ce travail a été l'analyse de la variabilité de la quantité d'aubier dans le tronc: en intra-arbre, la largeur d'aubier était constante sous la base du houppier; en inter-arbre, une forte corrélation avec la quantité de branches vivantes a notamment été mise en évidence. De nombreuses analyses sont envisageables à partir des résultats de notre travail, parmi lesquelles: l'étude architecturale des arbres avec le suivi de la moelle dans les billons et l'occurrence des prises de relais sur l'axe principal, l'analyse des variations radiales de la forme du duramen, l'analyse de la distribution des nœuds dans les billons.
|
10 |
Analyse sémantique d'un trafic routier dans un contexte de vidéo-surveillance / semantic analysis of road trafic in a context of video-surveillanceBrulin, Mathieu 25 October 2012 (has links)
Les problématiques de sécurité, ainsi que le coût de moins en moins élevé des caméras numériques, amènent aujourd'hui à un développement rapide des systèmes de vidéosurveillance. Devant le nombre croissant de caméras et l'impossibilité de placer un opérateur humain devant chacune d'elles, il est nécessaire de mettre en oeuvre des outils d'analyse capables d'identifier des évènements spécifiques. Le travail présenté dans cette thèse s'inscrit dans le cadre d'une collaboration entre le Laboratoire Bordelais de Recherche en Informatique (LaBRI) et la société Adacis. L'objectif consiste à concevoir un système complet de vidéo-surveillance destiné à l'analyse automatique de scènes autoroutières et la détection d'incidents. Le système doit être autonome, le moins supervisé possible et doit fournir une détection en temps réel d'un évènement.Pour parvenir à cet objectif, l'approche utilisée se décompose en plusieurs étapes. Une étape d'analyse de bas-niveau, telle que l'estimation et la détection des régions en mouvement, une identification des caractéristiques d'un niveau sémantique plus élevé, telles que l'extraction des objets et la trajectoire des objets, et l'identification d'évènements ou de comportements particuliers, tel que le non respect des règles de sécurité. Les techniques employées s'appuient sur des modèles statistiques permettant de prendre en compte les incertitudes sur les mesures et observations (bruits d'acquisition, données manquantes, ...).Ainsi, la détection des régions en mouvement s'effectue au travers la modélisation de la couleur de l'arrière-plan. Le modèle statistique utilisé est un modèle de mélange de lois, permettant de caractériser la multi-modalité des valeurs prises par les pixels. L'estimation du flot optique, de la différence de gradient et la détection d'ombres et de reflets sont employées pour confirmer ou infirmer le résultat de la segmentation.L'étape de suivi repose sur un filtrage prédictif basé sur un modèle de mouvement à vitesse constante. Le cas particulier du filtrage de Kalman (filtrage tout gaussien) est employé, permettant de fournir une estimation a priori de la position des objets en se basant sur le modèle de mouvement prédéfini.L'étape d'analyse de comportement est constituée de deux approches : la première consiste à exploiter les informations obtenues dans les étapes précédentes de l'analyse. Autrement dit, il s'agit d'extraire et d'analyser chaque objet afin d'en étudier son comportement. La seconde étape consiste à détecter les évènements à travers une coupe du volume 2d+t de la vidéo. Les cartes spatio-temporelles obtenues sont utilisées pour estimer les statistiques du trafic, ainsi que pour détecter des évènements telles que l'arrêt des véhicules.Pour aider à la segmentation et au suivi des objets, un modèle de la structure de la scène et de ses caractéristiques est proposé. Ce modèle est construit à l'aide d'une étape d'apprentissage durant laquelle aucune intervention de l'utilisateur n'est requise. La construction du modèle s'effectue à travers l'analyse d'une séquence d'entraînement durant laquelle les contours de l'arrière-plan et les trajectoires typiques des véhicules sont estimés. Ces informations sont ensuite combinées pour fournit une estimation du point de fuite, les délimitations des voies de circulation et une approximation des lignes de profondeur dans l'image. En parallèle, un modèle statistique du sens de direction du trafic est proposé. La modélisation de données orientées nécessite l'utilisation de lois de distributions particulières, due à la nature périodique de la donnée. Un mélange de lois de type von-Mises est utilisée pour caractériser le sens de direction du trafic. / Automatic traffic monitoring plays an important role in traffic surveillance. Video cameras are relatively inexpensive surveillance tools, but necessitate robust, efficient and automated video analysis algorithms. The loss of information caused by the formation of images under perspective projection made the automatic task of detection and tracking vehicles a very challenging problem, but essential to extract a semantic interpretation of vehicles behaviors. The work proposed in this thesis comes from a collaboration between the LaBRI (Laboratoire Bordelais de Recherche en Informatique) and the company Adacis. The aim is to elaborate a complete video-surveillance system designed for automatic incident detection.To reach this objective, traffic scene analysis proceeds from low-level processing to high-level descriptions of the traffic, which can be in a wide variety of type: vehicles entering or exiting the scene, vehicles collisions, vehicles' speed that are too fast or too low, stopped vehicles or objects obstructing part of the road... A large number of road traffic monitoring systems are based on background subtraction techniques to segment the regions of interest of the image. Resulted regions are then tracked and trajectories are used to extract a semantic interpretation of the vehicles behaviors.The motion detection is based on a statistical model of background color. The model used is a mixture model of probabilistic laws, which allows to characterize multimodal distributions for each pixel. Estimation of optical flow, a gradient difference estimation and shadow and highlight detection are used to confirm or invalidate the segmentation results.The tracking process is based on a predictive filter using a motion model with constant velocity. A simple Kalman filter is employed, which allow to predict state of objets based on a \textit{a priori} information from the motion model.The behavior analysis step contains two approaches : the first one consists in exploiting information from low-level and mid-level analysis. Objects and their trajectories are analysed and used to extract abnormal behavior. The second approach consists in analysing a spatio-temporal slice in the 3D video volume. The extracted maps are used to estimate statistics about traffic and are used to detect abnormal behavior such as stopped vehicules or wrong way drivers.In order to help the segmentaion and the tracking processes, a structure model of the scene is proposed. This model is constructed using an unsupervised learning step. During this learning step, gradient information from the background image and typical trajectories of vehicles are estimated. The results are combined to estimate the vanishing point of the scene, the lanes boundaries and a rough depth estimation is performed. In parallel, a statistical model of the trafic flow direction is proposed. To deal with periodic data, a von-Mises mixture model is used to characterize the traffic flow direction.
|
Page generated in 0.0851 seconds