Mobile terminals are arguably the most popular telecommunications device of the present day. With the expectation of use anytime, anywhere, mobile terminals are increasingly used in adverse scenarios such as in hands-free mode and in noisy environments. Speech quality is commonly degraded in such cases by the presence of acoustic echo and ambient noise. In consequence, mobile terminals are generally equipped with speech signal processing algorithms in order to assure acceptable speech quality. Classical approaches to speech signal processing involve independent acoustic echo cancellation, noise suppression and post-filtering. While performance is generally acceptable, degradations are noticeable at low signal-to-echo ratios (hands-free scenarios) and computational complexity can be high. Furthermore, while mobile terminals are increasingly equipped with multiple microphones, they are generally exploited for noise suppression alone, even if there is natural potential for combined noise suppression and echo control. This thesis presents new combination and synchronization architecture for acoustic echo cancellation for single- and dual-microphone devices. It moves beyond the current state-of-the-art by reducing computational complexity while improving performance in low signal-to-echo conditions. The thesis also presents the first dual-microphone solution to double-talk detection. These contributions pave the way for further applied research in speech processing; the novel architecture is readily extendible to multiple-microphone scenarios while respecting levels of computational efficiency required for integration in current mobile terminals. / Les téléphones mobiles sont sans aucun doute les terminaux de télécommunication le plus populaire de nos jours. Le besoin de mobilité étant toujours croissant, les téléphones mobiles sont parfois utilisés dans des conditions très adverses : mains-libres ou environnements bruités. Dans ces conditions, la qualité de la parole est perturbée par la présence de l'écho acoustique et du bruit ambiant. Les terminaux sont généralement équipés d'algorithmes de traitement de la parole afin de garantir une qualité de la parole acceptable. Composés d’un annuleur d’écho adaptatif, d’une réduction de bruit et d’une suppression d’écho résiduel, les chaines de traitement de parole classiques fournissent en général une qualité de la parole acceptable moyennant une complexité de calcul importante. Néanmoins, lorsque le rapport signal à écho est faible on peut noter des dégradations du signal utile. Les terminaux mobiles récents sont de plus en plus équipés de plusieurs microphones qui ne sont alors utilisés que pour la réduction de bruit bien qu’ils présentent un indéniable intérêt pour les systèmes de réduction conjointe de bruit et d’écho résiduel. Cette thèse présente une nouvelle architecture combinée d’annulation d’écho pour terminaux mobiles à un ou deux microphones. L’architecture proposée réduit efficacement la complexité de calcul tout en améliorant la qualité de la parole dans les scénarios défavorables. Nous présentons également la première solution bi-microphones de détection de double parole. Enfin, nos techniques bi-microphones peuvent facilement être appliquées aux terminaux multi-microphones et tout en ayant une capacité calculatoire acceptable pour les téléphones mobiles.
Identifer | oai:union.ndltd.org:theses.fr/2013ENST0081 |
Date | 18 June 2013 |
Creators | Yemdji Tchassi, Christelle |
Contributors | Paris, ENST, Evans, Nicholas W. D. |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | English, French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0021 seconds