Ce travail de thèse vise à proposer un modèle pouvant prédire l’intelligibilité d’une voix cible masquée par des sources concurrentes dans les salles. Un modèle a déjà été développé par Lavandier et Culling (2010) et est capable de prédire l’intelligibilité d’une cible en champ proche perturbée par plusieurs sources de bruit. Le travail présenté ici traite des nouvelles implémentations et expérimentations nécessaires pour étendre le modèle au cas de cibles distantes et au cas de voix concurrentes, qui présentent des propriétés acoustiques différentes des bruits stationnaires (fluctuation d’enveloppe, fréquence fondamentale, modulations de fréquence fondamentale). L’effet nuisible de la réverbération sur la parole cible a été implémenté avec succès. Cette nouvelle version du modèle permet une interprétation unifiée de plusieurs effetsperceptifs observés dans la littérature mais il présente une dépendance de la salle, ce qui limite son aspect prédictif. Des travaux expérimentaux ont été menés pour déterminer comment le modèle pourrait prendre en compte le cas de sources cibles et masquantes avec des spectres différents ainsi que le cas où plusieurs mécanismes auditifs opèrent simultanément (ségrégation par F0, démasquage spatialet écoute dans les creux de modulation). / This PhD work aims to propose a model predicting the perceived intelligibility of a target speech masked by competing sources in rooms. An existing model developed by Lavandier and Culling (2010) is already able to predict speech intelligibility of a near-field target in the presence of multiple noise sources. The present work deals with new implementations and experimental work needed to extend the model tothe case of a distant target and to the case of masking voices, which present different acoustical properties than noises (envelope fluctuations, fundamental frequency, modulations of fundamental frequency). The detrimental effect of reverberation on the target speech has been successfully implemented. This new version of the model provides a unified interpretation of several perceptual effects previously observed in the literature but it presents a room dependency which limits its predictive power. Experimental work has been conducted to determine how the model could account for sources presenting different spectra, and to account for several auditory mechanisms operating simultaneously (F0 segregation, spatial unmasking and temporal dip listening).
Identifer | oai:union.ndltd.org:theses.fr/2015ENTP0008 |
Date | 09 December 2015 |
Creators | Leclère, Thibaud |
Contributors | Vaulx-en-Velin, Ecole nationale des travaux publics, Dumortier, Dominique, Lavandier, Mathieu [Nicolas Jacky] |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0018 seconds