• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 14
  • 4
  • 3
  • 1
  • 1
  • Tagged with
  • 23
  • 23
  • 14
  • 6
  • 6
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Contributions à l'analyse de visages en 3D : approche régions, approche holistique et étude de dégradations

Lemaire, Pierre 29 March 2013 (has links)
Historiquement et socialement, le visage est chez l'humain une modalité de prédilection pour déterminer l'identité et l'état émotionnel d'une personne. Il est naturellement exploité en vision par ordinateur pour les problèmes de reconnaissance de personnes et d'émotions. Les algorithmes d'analyse faciale automatique doivent relever de nombreux défis : ils doivent être robustes aux conditions d'acquisition ainsi qu'aux expressions du visage, à l'identité, au vieillissement ou aux occultations selon le scénario. La modalité 3D a ainsi été récemment investiguée. Elle a l'avantage de permettre aux algorithmes d'être, en principe, robustes aux conditions d'éclairage ainsi qu'à la pose. Cette thèse est consacrée à l'analyse de visages en 3D, et plus précisément la reconnaissance faciale ainsi que la reconnaissance d'expressions faciales en 3D sans texture. Nous avons dans un premier temps axé notre travail sur l'apport que pouvait constituer une approche régions aux problèmes d'analyse faciale en 3D. L'idée générale est que le visage, pour réaliser les expressions faciales, est déformé localement par l'activation de muscles ou de groupes musculaires. Il est alors concevable de décomposer le visage en régions mimiques et statiques, et d'en tirer ainsi profit en analyse faciale. Nous avons proposé une paramétrisation spécifique, basée sur les distances géodésiques, pour rendre la localisation des régions mimiques et statiques le plus robustes possible aux expressions. Nous avons également proposé une approche régions pour la reconnaissance d'expressions du visage, qui permet de compenser les erreurs liées à la localisation automatique de points d'intérêt. Les deux approches proposées dans ce chapitre ont été évaluées sur des bases standards de l'état de l'art. Nous avons également souhaité aborder le problème de l'analyse faciale en 3D sous un autre angle, en adoptant un système de cartes de représentation de la surface 3D. Nous avons ainsi proposé de projeter sur le plan 2D des informations liées à la topologie de la surface 3D, à l'aide d'un descripteur géométrique inspiré d'une mesure de courbure moyenne. Les problèmes de reconnaissance faciale et de reconnaissance d'expressions 3D sont alors ramenés à ceux de l'analyse faciale en 2D. Nous avons par exemple utilisé SIFT pour l'extraction puis l'appariement de points d'intérêt en reconnaissance faciale. En reconnaissance d'expressions, nous avons utilisé une méthode de description des visages basée sur les histogrammes de gradients orientés, puis classé les expressions à l'aide de SVM multi-classes. Dans les deux cas, une méthode de fusion simple permet l'agrégation des résultats obtenus à différentes échelles. Ces deux propositions ont été évaluées sur la base BU-3DFE, montrant de bonnes performances tout en étant complètement automatiques. Enfin, nous nous sommes intéressés à l'impact des dégradations des modèles 3D sur les performances des algorithmes d'analyse faciale. Ces dégradations peuvent avoir plusieurs origines, de la capture physique du visage humain au traitement des données en vue de leur interprétation par l'algorithme. Après une étude des origines et une théorisation des types de dégradations potentielles, nous avons défini une méthodologie permettant de chiffrer leur impact sur des algorithmes d'analyse faciale en 3D. Le principe est d'exploiter une base de données considérée sans défauts, puis de lui appliquer des dégradations canoniques et quantifiables. Les algorithmes d'analyse sont alors testés en comparaison sur les bases dégradées et originales. Nous avons ainsi comparé le comportement de 4 algorithmes de reconnaissance faciale en 3D, ainsi que leur fusion, en présence de dégradations, validant par la diversité des résultats obtenus la pertinence de ce type d'évaluation. / Historically and socially, the human face is one of the most natural modalities for determining the identity and the emotional state of a person. It has been exploited by computer vision scientists within the automatic facial analysis domain. Still, proposed algorithms classically encounter a number of shortcomings. They must be robust to varied acquisition conditions. Depending on the scenario, they must take into account intra-class variations such as expression, identity (for facial expression recognition), aging, occlusions. Thus, the 3D modality has been suggested as a counterpoint for a number of those issues. In principle, 3D views of an object are insensitive to lightning conditions. They are, theoretically, pose-independant as well. The present thesis work is dedicated to 3D Face Analysis. More precisely, it is focused on non-textured 3D Face Recognition and 3D Facial Expression Recognition. In the first instance, we have studied the benefits of a region-based approach to 3D Face Analysis problems. The general concept is that a face, when performing facial expressions, is deformed locally by the activation of muscles or groups of muscles. We then assumed that it was possible to decompose the face into several regions of interest, assumed to be either mimic or static. We have proposed a specific facial surface parametrization, based upon geodesic distance. It is designed to make region localization as robust as possible regarding expression variations. We have also used a region-based approach for 3D facial expression recognition, which allows us to compensate for errors relative to automatic landmark localization. We also wanted to experiment with a Representation Map system. Here, the main idea is to project 3D surface topology data on the 2D plan. This translation to the 2D domain allows us to benefit from the large amount of related works in the litterature. We first represent the face as a set of maps representing different scales, with the help of a geometric operator inspired by the Mean Curvature measure. For Facial Recognition, we perform a SIFT keypoints extraction. Then, we match extracted keypoints between corresponding maps. As for Facial Expression Recognition, we normalize and describe every map thanks to the Histograms of Oriented Gradients algorithm. We further classify expressions using multi-class SVM. In both cases, a simple fusion step allows us to aggregate the results obtained on every single map. Finally, we have studied the impact of 3D models degradations over the performances of 3D facial analysis algorithms. A 3D facial scan may be an altered representation of its real life model, because of several reasons, which range from the physical caption of the human model to data processing. We propose a methodology that allows us to quantify the impact of every single type of degradation over the performances of 3D face analysis algorithms. The principle is to build a database regarded as free of defaults, then to apply measurable degradations to it. Algorithms are further tested on clean and degraded datasets, which allows us to quantify the performance loss caused by degradations. As an experimental proof of concept, we have tested four different algorithms, as well as their fusion, following the aforementioned protocol. With respect to the various types of contemplated degradations, the diversity of observed behaviours shows the relevance of our approach.
22

Stenosis of the Nasal Entrance of Brachycephalic Dogs – Objective Measurement Using 3D Morphometry

Weng, Tzu-Yi 16 November 2023 (has links)
Introduction: Stenotic nares are one of the most important characteristics of brachycephalic obstructive airway syndrome (BOAS), which was first described in 1949. However, although they have been mentioned in most texts about brachycephalic malformations, few studies have attempted to characterize the nasal entrance of dogs morphologically or functionally, and none of them have described it objectively with landmarks. Recently, as the popularity of brachycephalic dogs has exploded worldwide, innumumberable dogs are suffering from BOAS due to structural malformations. In the point of view of animal welfare, stenotic nares should be objectively evaluated to provide evidence of torture breeding. Objectives: The aim of this study was to objectively measure and thus characterize the nasal entrance stenosis of brachycephalic dogs in comparison to non-brachycephalic dogs. To this end, the following objectives were defined: 1. Our aim is to use three-dimensional (3D) soft-tissue morphometry to objectively measure the externally visible part of the nasal entrance of healthy and brachycephalic dogs. 2. Our aim is to define specific soft-tissue landmarks and parameters to objectively characterize the nasal entrance of dogs. 3. Compare 3D high-resolution scanning with computed tomography (CT) using the newly defined parameters. 4. Reexamine the nasal entrance with 3D scan six months after surgical correction of nasal entrance stenosis (Ala-vestibuloplasty). Animals, Material and Methods: Forty-five brachycephalic and 45 non-brachycephalic dogs were included in this study between 2018 and 2020. All the animals were referred to the Ear, Nose, and Throat Unit of the Small Animal Department at the University of Leipzig, either for surgical correction of BOAS or for endoscopic examination. Animals were excluded if their nasal entrance was potentially affected due to disease or previous surgery. All dogs were scanned with a 3D scanner under general anesthesia using a standardized anesthetic protocol before endoscopic intervention. The 3D scans and CT images were later imported into two advanced software (Amira, Thermo Fisher and Facial Analysis Tool) for objective measurement of the nasal entrance. Intra-observer error and ala-vestibuloplasty (AVP) efficacy of the CT images and 3D scans were tested and compared. All the data were normalized using Shapiro–Wilk normality test. All statistical analyses were later performed using Pearson or Spearman test for correlation, paired t-test, or t-test. Paired t-test was used to test whether the mean difference between pairs of measurements was zero. If it was not the same group of animals, t-test was used instead. Results: We defined new specific soft-tissue landmarks to calculate the nasal opening area (NOA) and stenotic angle (SA) to objectively describe the canine nasal entrance. The NOA and SA were significantly smaller in brachycephalic dogs than in non-brachycephalic dogs, and the NOA was significantly correlated with body weight, whereas SA was not. After nasal entrance correction via AVP, the nasal entrances were 295%left and 233%right larger than before surgery in brachycephalic dogs. Intra-observer reliability was tested with excellent significance through NOA measurements. Comparison between the 3D scanner and CT was measured with the NOA, and it did not show a significant difference between the methods. Conclusion: Obtaining the NOA and SA using 3D surface scans seems to be a reliable and reproducible tool for precise objective evaluation of the visible canine nasal entrance. With the measurement of derived NOA and SA, all the brachycephalic dogs in the study were found to have stenotic nares, and all they required AVP to relieve breathing difficulty. The brachycephalic nasal entrances were increased significantly after AVP, the modified nare correction surgery. We consider the results of our study strong evidence that the breeding of brachycephalic dogs is torture breeding. The restriction of nasal breathing due to the extreme reduction of the nasal entrance to a fraction of the size of that of non-brachycephalic dogs is obvious evidence of this.:1 INTRODUCTION - 1 - 1.1 General Introduction - 1 - 1.2 Objectives - 2 - 2 OVERVIEW OF THE LITERATURE - 3 - 2.1 Brachycephalic Obstructive Airway Syndrome (BOAS) - 3 - 2.1.1 General Introduction of BOAS - 3 - 2.1.2 How to Define Brachycephalic Dogs - 3 - 2.1.3 Commonly Affected Breeds - 4 - 2.2 The Canine Nasal Entrance - 4 - 2.2.1 Anatomy of the Canine Nasal Entrance and Stenosis - 4 - 2.2.2 Pathophysiology of Stenotic Nares in Brachycephalic Dogs - 5 - 2.3 Diagnosis of Stenotic Nares - 9 - 2.3.1 Visual Assessment - 9 - 2.3.2 Nostril Ratio - 11 - 2.3.3 Air Volume of the Nasal Entrance - 11 - 2.4 Development of Morphometry in Brachycephalic Dogs - 11 - 2.5 3D Scanners for 3D Model Reconstruction - 12 - 2.6 Landmarks - 14 - 2.6.1 Introduction of Landmarks - 14 - 2.6.2 Development of Landmarks in Human Medicine - 15 - 2.6.3 Development of Landmarks in Veterinary Medicine - 16 - 2.6.4 Cephalometric Analysis Software - 17 - 3 ANIMALS AND METHODS - 19 - 3.1 Animals - 19 - 3.2 Methods - 19 - 3.2.1 3D Scanning Process and Set-ups of Canine Nasal Entrance - 19 - 3.2.2 Cephalomorphometric Software - 20 - 3.2.3 Cephalometric Landmarks - 20 - 3.2.4 Advanced Morphometric Parameters for Nares - 22 - 3.2.5 Efficacy of Ala-Vestibuloplasty (AVP) - 24 - 3.2.6 Comparison between CT and the 3D Scanning Tool - 24 - 3.2.7 Intra-observer Reliability - 25 - 3.2.8 Statistics - 25 - 4 RESULTS - 26 - 4.1 Brachycephalic Dogs and Non-brachycephalic Dogs - 26 - 4.2 The Nasal Opening Area (NOA) - 28 - 4.3 Efficacy of Ala-Vestibulopasty - 30 - 4.4 Stenotic Angle (SA) - 31 - 4.5 Comparison between CT and the 3D Scanning Tool - 32 - 4.6 Intra-observer Reliability - 34 - 5 DISCUSSION - 36 - 5.1 The Nasal Entrance - 36 - 5.2 Method: the 3D Scanner - 37 - 5.3 Method: Comparison between CT and the 3D Scanner - 38 - 5.4 Method: Landmarks and Reproducibility, Intra-observer Reliability - 39 - 5.5 Nasal Opening Area (NOA) and Efficacy of Ala-Vestibuloplasty (AVP) - 42 - 5.6 Stenotic Angle (SA) - 44 - 5.7 Animal Welfare - 45 - 6 SUMMARY - 47 - 7 ZUSAMMENFASSUNG - 49 - 8 REFERENCES - 51 - / Einleitung: Die Naseneingangstenose ist eine der wichtigsten Merkmale des brachyzephalen Syndroms (BOAS), das erstmals 1949 beschrieben wurde. Obwohl diese komplexe Stenose in den meisten Texten über brachyzephale Fehlbildungen erwähnt wird, haben nur wenige Studien versucht, den Naseneingang von Hunden morphologisch oder funktionell zu charakterisieren. Eine objektive Beschreibung mit Landmarken ist bisher nicht bekannt. In den letzten Jahren ist die Popularität brachyzephaler Hunde weltweit explodiert. Unzählige Hunde leiden aufgrund struktureller Fehlbildungen an BOAS. Unter dem Gesichtspunkt des Tierschutzes sollte die einzige, mit bloßem Auge sichtbare Stenose der oberen Atemwege brachyzephaler Hunde, die Stenose des Naseneingangs objektiv bewertet werden können, um Hinweise auf eine Qualzucht zu belegen. Zielsetzung: Ziel dieser Studie war es, den Naseneingang von brachyzephalen Hunden im Vergleich zu nicht-brachyzephalen Hunden objektiv zu messen und damit die Stenose des Naseneingangs zu charakterisieren und eine chirurgische Therapie, die Ala-Vestibuloplastie (AVP), zu evaluieren. Zu diesem Zweck wurden die folgenden Ziele definiert: 1. Anwendung der dreidimensionalen (3D) Weichteilmorphometrie zur objektiven Messung des äußerlich sichtbaren Teils des Naseneingangs von gesunden und brachyzephalen Hunden. 2. Definition spezifischer Weichteil-Landmarken und Parameter zur objektiven Charakterisierung des Naseneingangs von Hunden. 3. Methoden-Vergleich zwischen den hochauflösenden 3D-Scans und der Computertomographie (CT) unter Verwendung der neu definierten Parameter. 4. Kontrolluntersuchung mit 3D-Scan sechs Monate nach der chirurgischen Korrektur der Naseneingangsstenose (Ala-Vestibuloplastik). Tiere und Methoden: 45 brachyzephale und 45 nicht-brachyzephale Hunde wurden zwischen 2018 und 2020 in diese Studie aufgenommen und wurden an die Hals-Nasen-Ohren-Abteilung der Kleintierklinik der Universität Leipzig überwiesen, zur endoskopischen Untersuchung der oberen Atemwege und gegebenenfalls zur chirurgischen Korrektur der BOAS-assozierten Stenosen. Ausgeschlossen wurden Tiere, deren Naseneingang aufgrund von Krankheiten oder einer früheren Operation verändert war. Alle Hunde wurden nach einem standardisierten Anästhesieprotokoll anästhesiert, ein Computertomogramm des Kopfes erstellt und vor dem endoskopischen Eingriff wurde der Kopf mit einem 3D-Scanner gescannt. Die 3D-Scans und CT-Bilder wurden in zwei Softwareprogramme (Amira, Thermo Fisher und Facial Analysis Tool) zur objektiven Messung des Naseneingangs importiert. Zur genauen Charakterisierung wurden neue Landmarken am Naseneingang definiert und zur Berechnung von zwei neuen, abgeleiteten Parametern, der Nasenöffnungsfläche (NOA) und dem stenotischen Winkel (SA) verwendet. Der Intraobserver-Fehler und die Wirksamkeit der Ala-Vestibuloplastie wurden anhand der CT-Bilder und 3D-Scans mit demselben Verfahren geprüft und verglichen. Alle statistischen Analysen wurden später mit dem Pearson-Test oder dem Spearman-Test für die Korrelation, dem gepaarten t-Test oder dem t-Test durchgeführt. Der gepaarte t-Test wurde verwendet, um zu prüfen, ob der Mittelwertunterschied zwischen Paaren von Messungen gleich Null war. Handelte es sich nicht um dieselbe Gruppe von Tieren, wurde stattdessen der t-Test verwendet. Ergebnisse: Mit den neu definierten spezifischen Weichteil-Landmarken und den abgeleiteten Parametern NOA und SA konnte der Naseneingang aller brachyzephalen und nicht-brachyzephalen Hunde objektiv beschrieben werden. NOA und SA waren bei brachyzephalen Hunden signifikant kleiner als bei nicht-brachyzephalen Hunden. NOA korrelierte in beiden Gruppen signifikant mit dem Körpergewicht. Dagegen zeigte SA keine Korrelation mit dem Körpergewicht. Nach der chirurgischen AVP waren die Naseneingänge bei allen brachyzephalen Hunden größer als vor der Operation, mit einer Zunahme der NOA links um 295 % und rechts um 233 %. Die Intraobserver-Zuverlässigkeit wurde durch NOA-Messungen getestet und war hoch signifikant. Zum Methoden-Vergleich zwischen 3D-Scanner und CT wurde die Nasenöffnungsfläche jeweils am gemessen und zeigte keinen signifikanten Unterschied zwischen den Methoden. Schlussfolgerungen: Morphometrische Messungen mit 3D-Oberflächenscans scheinen ein zuverlässiges und reproduzierbares Instrument zur präzisen, objektiven Bewertung des Naseneingangs des Hundes zu sein. Bei der Messung der abgeleiteten Flächen (NOA) und Winkel (SA) wurde bei allen brachyzephalen Hunden dieser Studie eine Naseneingangsstenose festgestellt. Nach der chirurgischen Korrektur der brachyzephalen Naseneingangsstenose, der AVP, waren die Nasenöffnungen deutlich vergrößert. Die Einschränkung der Nasenatmung durch die extreme Verkleinerung des Naseneingangs auf einen Bruchteil der Größe von nicht-brachyzephalen Hunden, betrachten wir als eindeutigen Beweis dafür, dass die Zucht von brachyzephalen Hunden eine Qualzucht ist.:1 INTRODUCTION - 1 - 1.1 General Introduction - 1 - 1.2 Objectives - 2 - 2 OVERVIEW OF THE LITERATURE - 3 - 2.1 Brachycephalic Obstructive Airway Syndrome (BOAS) - 3 - 2.1.1 General Introduction of BOAS - 3 - 2.1.2 How to Define Brachycephalic Dogs - 3 - 2.1.3 Commonly Affected Breeds - 4 - 2.2 The Canine Nasal Entrance - 4 - 2.2.1 Anatomy of the Canine Nasal Entrance and Stenosis - 4 - 2.2.2 Pathophysiology of Stenotic Nares in Brachycephalic Dogs - 5 - 2.3 Diagnosis of Stenotic Nares - 9 - 2.3.1 Visual Assessment - 9 - 2.3.2 Nostril Ratio - 11 - 2.3.3 Air Volume of the Nasal Entrance - 11 - 2.4 Development of Morphometry in Brachycephalic Dogs - 11 - 2.5 3D Scanners for 3D Model Reconstruction - 12 - 2.6 Landmarks - 14 - 2.6.1 Introduction of Landmarks - 14 - 2.6.2 Development of Landmarks in Human Medicine - 15 - 2.6.3 Development of Landmarks in Veterinary Medicine - 16 - 2.6.4 Cephalometric Analysis Software - 17 - 3 ANIMALS AND METHODS - 19 - 3.1 Animals - 19 - 3.2 Methods - 19 - 3.2.1 3D Scanning Process and Set-ups of Canine Nasal Entrance - 19 - 3.2.2 Cephalomorphometric Software - 20 - 3.2.3 Cephalometric Landmarks - 20 - 3.2.4 Advanced Morphometric Parameters for Nares - 22 - 3.2.5 Efficacy of Ala-Vestibuloplasty (AVP) - 24 - 3.2.6 Comparison between CT and the 3D Scanning Tool - 24 - 3.2.7 Intra-observer Reliability - 25 - 3.2.8 Statistics - 25 - 4 RESULTS - 26 - 4.1 Brachycephalic Dogs and Non-brachycephalic Dogs - 26 - 4.2 The Nasal Opening Area (NOA) - 28 - 4.3 Efficacy of Ala-Vestibulopasty - 30 - 4.4 Stenotic Angle (SA) - 31 - 4.5 Comparison between CT and the 3D Scanning Tool - 32 - 4.6 Intra-observer Reliability - 34 - 5 DISCUSSION - 36 - 5.1 The Nasal Entrance - 36 - 5.2 Method: the 3D Scanner - 37 - 5.3 Method: Comparison between CT and the 3D Scanner - 38 - 5.4 Method: Landmarks and Reproducibility, Intra-observer Reliability - 39 - 5.5 Nasal Opening Area (NOA) and Efficacy of Ala-Vestibuloplasty (AVP) - 42 - 5.6 Stenotic Angle (SA) - 44 - 5.7 Animal Welfare - 45 - 6 SUMMARY - 47 - 7 ZUSAMMENFASSUNG - 49 - 8 REFERENCES - 51 -
23

Non-linear dimensionality reduction and sparse representation models for facial analysis / Réduction de la dimension non-linéaire et modèles de la représentations parcimonieuse pour l’analyse du visage

Zhang, Yuyao 20 February 2014 (has links)
Les techniques d'analyse du visage nécessitent généralement une représentation pertinente des images, notamment en passant par des techniques de réduction de la dimension, intégrées dans des schémas plus globaux, et qui visent à capturer les caractéristiques discriminantes des signaux. Dans cette thèse, nous fournissons d'abord une vue générale sur l'état de l'art de ces modèles, puis nous appliquons une nouvelle méthode intégrant une approche non-linéaire, Kernel Similarity Principle Component Analysis (KS-PCA), aux Modèles Actifs d'Apparence (AAMs), pour modéliser l'apparence d'un visage dans des conditions d'illumination variables. L'algorithme proposé améliore notablement les résultats obtenus par l'utilisation d'une transformation PCA linéaire traditionnelle, que ce soit pour la capture des caractéristiques saillantes, produites par les variations d'illumination, ou pour la reconstruction des visages. Nous considérons aussi le problème de la classification automatiquement des poses des visages pour différentes vues et différentes illumination, avec occlusion et bruit. Basé sur les méthodes des représentations parcimonieuses, nous proposons deux cadres d'apprentissage de dictionnaire pour ce problème. Une première méthode vise la classification de poses à l'aide d'une représentation parcimonieuse active (Active Sparse Representation ASRC). En fait, un dictionnaire est construit grâce à un modèle linéaire, l'Incremental Principle Component Analysis (Incremental PCA), qui a tendance à diminuer la redondance intra-classe qui peut affecter la performance de la classification, tout en gardant la redondance inter-classes, qui elle, est critique pour les représentations parcimonieuses. La seconde approche proposée est un modèle des représentations parcimonieuses basé sur le Dictionary-Learning Sparse Representation (DLSR), qui cherche à intégrer la prise en compte du critère de la classification dans le processus d'apprentissage du dictionnaire. Nous faisons appel dans cette partie à l'algorithme K-SVD. Nos résultats expérimentaux montrent la performance de ces deux méthodes d'apprentissage de dictionnaire. Enfin, nous proposons un nouveau schéma pour l'apprentissage de dictionnaire adapté à la normalisation de l'illumination (Dictionary Learning for Illumination Normalization: DLIN). L'approche ici consiste à construire une paire de dictionnaires avec une représentation parcimonieuse. Ces dictionnaires sont construits respectivement à partir de visages illuminées normalement et irrégulièrement, puis optimisés de manière conjointe. Nous utilisons un modèle de mixture de Gaussiennes (GMM) pour augmenter la capacité à modéliser des données avec des distributions plus complexes. Les résultats expérimentaux démontrent l'efficacité de notre approche pour la normalisation d'illumination. / Face analysis techniques commonly require a proper representation of images by means of dimensionality reduction leading to embedded manifolds, which aims at capturing relevant characteristics of the signals. In this thesis, we first provide a comprehensive survey on the state of the art of embedded manifold models. Then, we introduce a novel non-linear embedding method, the Kernel Similarity Principal Component Analysis (KS-PCA), into Active Appearance Models, in order to model face appearances under variable illumination. The proposed algorithm successfully outperforms the traditional linear PCA transform to capture the salient features generated by different illuminations, and reconstruct the illuminated faces with high accuracy. We also consider the problem of automatically classifying human face poses from face views with varying illumination, as well as occlusion and noise. Based on the sparse representation methods, we propose two dictionary-learning frameworks for this pose classification problem. The first framework is the Adaptive Sparse Representation pose Classification (ASRC). It trains the dictionary via a linear model called Incremental Principal Component Analysis (Incremental PCA), tending to decrease the intra-class redundancy which may affect the classification performance, while keeping the extra-class redundancy which is critical for sparse representation. The other proposed work is the Dictionary-Learning Sparse Representation model (DLSR) that learns the dictionary with the aim of coinciding with the classification criterion. This training goal is achieved by the K-SVD algorithm. In a series of experiments, we show the performance of the two dictionary-learning methods which are respectively based on a linear transform and a sparse representation model. Besides, we propose a novel Dictionary Learning framework for Illumination Normalization (DL-IN). DL-IN based on sparse representation in terms of coupled dictionaries. The dictionary pairs are jointly optimized from normally illuminated and irregularly illuminated face image pairs. We further utilize a Gaussian Mixture Model (GMM) to enhance the framework's capability of modeling data under complex distribution. The GMM adapt each model to a part of the samples and then fuse them together. Experimental results demonstrate the effectiveness of the sparsity as a prior for patch-based illumination normalization for face images.

Page generated in 0.0476 seconds