11 |
Production de la voix : exploration, modèles et analyse/synthèseHézard, Thomas 09 December 2013 (has links) (PDF)
Ce travail porte sur l'étude de la production de la voix. L'objectif principal est de proposer des solutions pour son analyse-synthèse qui permettent une large représentation de la diversité des signaux biométriques (observés en pratique) dans le cadre du paradigme source-filtre ou de modèles physiques simplifiés. L'étude est menée selon trois axes : l'exploration de l'activité laryngée, la modélisation de la phonation et l'analyse-synthèse sonore. Après une description de l'appareil phonatoire et de modèles d'analyse-synthèse actuels, la première partie s'intéresse à l'exploration de signaux biométriques. A partir du recensement des dispositifs actuels, nous proposons un outil de synchronisation qui révèle la complexité du mouvement 3D des plis vocaux. Une étude comparative avec un système acoustique à valve humaine similaire (lèvres d'un tromboniste) est menée et le développement d'un nouvel outil combinant deux techniques récentes d'imagerie électrique est proposé. Dans la deuxième partie, deux algorithmes d'analyse sont proposés pour un modèle source-filtre fondé sur une représentation tous-pôles causale-anticausale du signal vocal. Un calcul du cepstre complexe est proposé, garantissant l'holomorphie sur une couronne de convergence dans le domaine en Z. Cet outil est alors exploité pour la séparation de la source et du filtre. Enfin, des représentations paramétriques des signaux d'aire glottique sont exploitées pour piloter des modèles à géométrie forcée. Un modèle de synthèse, inspiré du modèle source-filtre mais intégrant l'effet du couplage entre la glotte et le conduit vocal, et des avancées sur la modélisation de conduit vocal à profil régulier sont présentées.
|
12 |
Adaptation du contenu spatio-temporel des images pour un codage par ondelettesLe Guen, Benjamin 14 February 2008 (has links) (PDF)
Les limites de l'ondelette séparable standard, dans le cas 2D, sont bien connues. Le support rectangulaire fixe de l'ondelette ne permet pas d'exploiter la géométrie des images et en particulier les corrélations le long de contours courbes. Ceci se traduit par une dispersion de l'énergie des coefficients dans le domaine ondelette et produit un phénomène de rebonds gênant visuellement lors d'une approximation avec un petit nombre de coefficients. Pour y remédier, une seconde génération d'ondelettes est née. L'approche la plus courante est de déformer le noyau d'ondelette pour l'adapter au contenu géométrique d'une image. <br />Dans cette thèse, nous proposons d'aborder le problème d'adaptativité sous un angle différent. L'idée est de déformer le contenu d'une image pour l'adapter au noyau d'ondelette séparable standard. La déformation est modélisée par un maillage déformable et le critère d'adaptation utilisé est le coût de description de l'image déformée. Une minimisation énergétique similaire à une estimation de mouvement est mise en place pour calculer les paramètres du maillage. A l'issue de cette phase d'analyse, l'image est représentée par une image déformée de moindre coût de codage et par les paramètres de déformation. Après codage, transmission et décodage de ces inforrnations, l'image d'origine peut être synthétisée en inversant la déformation. Les performances en compression de ce schéma par analyse-synthèse spatiales sont étudiées et comparées à celles de JPEG2000. Visuellement, on observe une meilleure reconstruction des contours des images avec une atténuation significative de l'effet rebond. <br />Conservant l'idée d'adapter le contenu des images à un noyau de décomposition fixe, nous proposons ensuite un schéma de codage par analyse-synthèse spatio-temporelles dédié à la vidéo. L'analyse prend en entrée un groupe d'images (GOF) et génère en sortie un groupe d'images déformées dont le contenu est adapté à une décomposition 3D horizontale-verticale-temporelle fixe. Le schéma est conçu de sorte qu'une seule géométrie soit estimée et transmise pour l'ensemble du GOF. Des résultats de compression sont présentés en utilisant le maillage déformable pour modéliser la géométrie et le mouvement. Bien qu'une seule géométrie soit encodée, nous montrons que son coût est trop important pour permettre une amélioration significative de la qualité visuelle par rapport à un schéma par analyse-synthèse exploitant uniquement le mouvement.
|
Page generated in 0.0578 seconds