La détection de la hauteur tonale dans un signal de parole est un problème complexe et important pour des applications en reconnaissance de parole continue. Lorsqu'on souhaite détecter la hauteur tonale sur la parole téléphonique, la difficulté est plus grande, puisque la fréquence fondamentale n'est pas claire dans le signal. Nous proposons un modèle pratique basé sur des connaissances psychoacoustiques et physiologiques de l'oreille. En effet, cette dernière est capable d'extraire la hauteur tonale du signal de parole téléphonique. Le modèle proposé comprend trois éléments: un banc de filtres auditifs qui simule les mouvements mécaniques de la membrane basilaire; un modèle fonctionnel qui calcule des pseudo-histogrammes périodiques reliés à la période de la fréquence fondamentale; l'élément final combine la sortie des histogrammes pour extraire la hauteur tonale. Ce modèle est testé sur des données de parole numérisées à travers le réseau téléphonique de la région de Montréal. Les résultats des expériences indiquent que cette approche permet d'obtenir la hauteur tonale même si l'énergie de la composante fondamentale du signal de parole est très faible.
Identifer | oai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QCU.1456 |
Date | January 1992 |
Creators | Liu, Yong Chun |
Source Sets | Library and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada |
Detected Language | French |
Type | Thèse ou mémoire de l'UQAC, NonPeerReviewed |
Format | application/pdf |
Relation | http://constellation.uqac.ca/1456/ |
Page generated in 0.0019 seconds