L'objectif de cette thèse est l'estimation de la pose de la tête humaine à partir d'imagesmonoculaires. Le but est d'avoir un retour d'information de l'utilisateur sur l'orientationde son regard, et ce, de manière non-intrusive. Ce domaine de recherche est très actifcompte tenu de l'évolution des interfaces de communication entre l'homme et la machine,d'autant plus que plusieurs défis sont toujours ouverts. Notamment, la robustesse dusystème, son invariabilité à l'identité des personnes et à l'illumination ainsi que la qualitédu matériel de capture requis.L'approche que nous avons proposée est basée sur la symétrie bilatérale du visage.Nous utilisons des caractéristiques extraites de la symétrie pour estimer la pose de latête par le biais de l'apprentissage. Les caractéristiques utilisées sont géométriques maisextraites de manière globale à partir de toute la texture du visage, sans que des pointsou des contours spécifiques ne soient requis.Ces caractéristiques ont été validées expérimentalement à l'aide de bases d'images etde vidéos publiques dédiées à l'estimation de la pose de la tête. L'apprentissage superviséainsi que la régression sont utilisés pour construire des modèles de poses. Ces modèles ontété testés sur des séquences vidéo indépendantes des bases utilisées pour l'apprentissage.L'erreur d'estimation a été calculée et les résultats sont supérieurs ou équivalents à l'étatde l'art. / The aim of this thesis is to estimate the pose of a human head frommonocular images. The goal is to have a feedback from the user on the direction of hisgaze, and this is done in a non-intrusive manner. This area of research is very activegiven the evolution of the communication interfaces between a human and a machine,especially as many challenges are still there. In particular, the robustness of the system,its invariance to the identity of individuals and enlightenment.The approach we propose is based on the bilateral symmetry of the face. We usefeatures extracted from the symmetry to estimate head pose through learning. Thefeatures used are geometric but extracted holistically from the whole texture of the face,without the need for specifc points or contours.These features have been experimentally validated by means of publicly availabledatabases of images and videos dedicated to head pose estimation. Supervised learningand regression have been used to build models of poses. These models have been testedon video sequences different from the bases used for learning. The estimation error hasbeen calculated and the results are superior or equivalent to the state of the art.
Identifer | oai:union.ndltd.org:theses.fr/2015LIL10010 |
Date | 01 February 2015 |
Creators | Dahmane, Afifa |
Contributors | Lille 1, Université des sciences et de la technologie Houari Boumediene (Alger), Djeraba, Chaabane, Larabi, Slimane |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0019 seconds