Return to search

Analyse de la qualité vocale appliquée à la parole expressive

L'analyse des signaux de parole permet de comprendre le fonctionnement de l'appareil vocal, mais aussi de décrire de nouveaux paramètres permettant de qualifier et quantifier la perception de la voix. Dans le cas de la parole expressive, l'intérêt se porte sur des variations importantes de qualité vocales et sur leurs liens avec l'expressivité et l'intention du sujet. Afin de décrire ces liens, il convient de pouvoir estimer les paramètres du modèle de production mais aussi de décomposer le signal vocal en chacune des parties qui contribuent à ce modèle. Le travail réalisé au cours de cette thèse s'axe donc autour de la segmentation et la décomposition des signaux vocaux et de l'estimation des paramètres du modèle de production vocale : Tout d'abord, la décomposition multi-échelles des signaux vocaux est abordée. En reprenant la méthode LoMA qui trace des lignes suivant les amplitudes maximum sur les réponses temporelles au banc de filtre en ondelettes, il est possible d'y détecter un certain nombre de caractéristiques du signal vocal : les instants de fermeture glottique, l'énergie associée à chaque cycle ainsi que sa distribution spectrale, le quotient ouvert du cycle glottique (par l'observation du retard de phase du premier harmonique). Cette méthode est ensuite testée sur des signaux synthétiques et réels. Puis, la décomposition harmonique + bruit des signaux vocaux est abordée. Une méthode existante (PAPD - Périodic/APériodic Décomposition) est adaptée aux variations de fréquence fondamentale par le biais de la variation dynamique de la taille de la fenêtre d'analyse et est appelée PAP-A. Cette nouvelle méthode est ensuite testée sur une base de signaux synthétiques. La sensibilité à la précision d'estimation de la fréquence fondamentale est notamment abordée. Les résultats montrent des décompositions de meilleures qualité pour PAP-A par rapport à PAPD. Ensuite, le problème de la déconvolution source/filtre est abordé. La séparation source/filtre par ZZT (zéros de la transformée en Z) est comparée aux méthodes usuelles à base de prédiction linéaire. La ZZT est utilisée pour estimer les paramètres du modèle de la source glottique via une méthode simple mais robuste qui permet une estimation conjointe de deux paramètres du débit glottique : le quotient ouvert et l'asymétrie. La méthode ainsi développée est testée et combinée à l'estimation du quotient ouvert par ondelettes. Finalement, ces trois méthodes d'estimations sont appliquées à un grand nombre de fichiers d'une base de données comportant différents styles d'élocution. Les résultats de cette analyse sont discutés afin de caractériser le lien entre style, valeur des paramètres de la production vocale et qualité vocale. On constate notamment l'émergence très nette de groupes de styles.

  1. http://tel.archives-ouvertes.fr/tel-00591638
  2. 2011PA112021
  3. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_PAP_Fricative1_ORIG.wav
  4. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_M202-V-PAPA.wav
  5. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_ZZT-C3.wav
  6. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C202.wav
  7. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_PAP_Fricative1_NOIS.wav
  8. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_PAP_Fricative1_PERI.wav
  9. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C203-V-PAPA.wav
  10. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_LOMA-Voyelle1.wav
  11. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_LOMA-NORMVoyelle3.wav
  12. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C203.wav
  13. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_ZZT-M1.wav
  14. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_PAP_Voyelle1_NOIS.wav
  15. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_PAP_Voyelle1_PERI.wav
  16. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_ZZT-C5.wav
  17. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C203-N-PAPA.wav
  18. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_LOMA-NORMVoyelle2.wav
  19. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_PAP_Voyelle1_ORIG.wav
  20. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_M202-N-PAPA.wav
  21. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_LOMA-NORMVoyelle1.wav
  22. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_LOMA-Voyelle3.wav
  23. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C202-V-PAP.wav
  24. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C203-N-PAP.wav
  25. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C203-V-PAP.wav
  26. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C202-N-PAP.wav
  27. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_ZZT-C1.wav
  28. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C202-N-PAPA.wav
  29. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_C202-V-PAPA.wav
  30. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_LOMA-Voyelle2.wav
  31. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_M202-V-PAP.wav
  32. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_M202.wav
  33. http://tel.archives-ouvertes.fr/docs/00/59/16/38/ANNEX/VA2_STURMEL_NICOLAS_02032011_M202-N-PAP.wav
  34. http://tel.archives-ouvertes.fr/docs/00/59/16/38/PDF/VA2_STURMEL_NICOLAS_02032011.pdf
Identiferoai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00591638
Date02 March 2011
CreatorsSturmel, Nicolas
PublisherUniversité Paris Sud - Paris XI
Source SetsCCSD theses-EN-ligne, France
LanguageFrench
Detected LanguageFrench
TypePhD thesis

Page generated in 0.0023 seconds