Avec la généralisation de l'écoute au casque, la technique binaurale apparaît comme une solution privilégiée pour démocratiser l'accès à des contenus sonores spatialisés. La synthèse binaurale repose sur l'utilisation de filtres appelés HRTFs qui restituent à l'auditeur l'ensemble des indices acoustiques de localisation. Ceux-ci possèdent une composante individuelle forte et l'utilisation de filtres non-individuels entraîne des défauts de localisation ou de timbre à la restitution. L’acquisition individuelle des HRTFs requiert un dispositif de mesure complexe. Les méthodes d’individualisation visent à offrir des solutions alternatives à cette mesure individuelle et reposent généralement sur l’exploitation de bases de données de HRTFs. A cet effet, une nouvelle base de données de HRTFs à haute résolution spatiale et fréquentielle a été constituée. Le développement d’un modèle visant à prédire les directions perçues de sources virtuelles synthétisées avec des HRTFs non-individuelles constitue le cœur du travail de thèse. La métrique utilisée pour quantifier la similarité entre HRTFs fait l’objet d’une attention particulière. L’objectif ultime est d’évaluer dans quelle mesure ce modèle peut être utilisé pour sélectionner le jeu de HRTFs optimal pour un individu à partir de ses réponses dans un test de localisation de sources sonores virtuelles synthétisées avec des HRTFs non-individuelles. La mise en place de tels tests implique l’utilisation d’une méthode de report, responsable d’une part d’erreur dans les réponses. La thèse comprend une étude comparative de 3 méthodes de report et la préconisation d’une méthode mieux adaptée au contexte de l’écoute binaurale au casque. / With the spread of headphone listening, binaural technology appears as the most appropriate solution to democratize the access to spatialized audio contents. Binaural synthesis of virtual sound sources is based on the use of filters called HRTFs, which provide the listener with accurate localization cues. These cues are however highly listener-dependent and the use of non-individual HRTFs may lead to localization and timbre artefacts.Individual acquisition of HRTFs requires a complex measurement setup installed in an anechoic chamber which is incompatible with large scale deployment. Therefore, individualization methods have been devised in order to offer alternatives to this individual measurement. They are often based on the exploitation of large HRTFs databases. To this end, a new HRTFs database with high spatial and frequency resolution has been created. The development of a model that predicts the perceived direction of a virtual source synthesized with non-individual HRTFs is the core of the thesis work. The choice of the metric used for quantifying the similarity between HRTFs receives a particular attention. The ultimate goal is to evaluate how such a model can be used to select automatically the optimal HRTFs set for an individual, from the observation of his responses in a localization test of virtual sound sources synthesized with non-individual HRTFs. The implementation of such a test implies the use of a reporting method, which may introduce some bias in the responses. This thesis includes a comparative study of 3 reporting methods and the recommendation of a method more suitable in the context of binaural listening through headphones.
Identifer | oai:union.ndltd.org:theses.fr/2016PA066452 |
Date | 14 December 2016 |
Creators | Bahu, Hélène |
Contributors | Paris 6, Assayag, Gérard, Warusfel, Olivier |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French, English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0017 seconds