31 |
Optimization and improvements in spatial sound reproduction systems through perceptual considerationsGutiérrez Parera, Pablo 07 May 2020 (has links)
[ES] La reproducción de las propiedades espaciales del sonido es una cuestión cada vez más importante en muchas aplicaciones inmersivas emergentes. Ya sea en la reproducción de contenido audiovisual en entornos domésticos o en cines, en sistemas de videoconferencia inmersiva o en sistemas de realidad virtual o aumentada, el sonido espacial es crucial para una sensación de inmersión realista. La audición, más allá de la física del sonido, es un fenómeno perceptual influenciado por procesos cognitivos. El objetivo de esta tesis es contribuir con nuevos métodos y conocimiento a la optimización y simplificación de los sistemas de sonido espacial, desde un enfoque perceptual de la experiencia auditiva. Este trabajo trata en una primera parte algunos aspectos particulares relacionados con la reproducción espacial binaural del sonido, como son la escucha con auriculares y la personalización de la Función de Transferencia Relacionada con la Cabeza (Head Related Transfer Function - HRTF). Se ha realizado un estudio sobre la influencia de los auriculares en la percepción de la impresión espacial y la calidad, con especial atención a los efectos de la ecualización y la consiguiente distorsión no lineal. Con respecto a la individualización de la HRTF se presenta una implementación completa de un sistema de medida de HRTF y se introduce un nuevo método para la medida de HRTF en salas no anecoicas. Además, se han realizado dos experimentos diferentes y complementarios que han dado como resultado dos herramientas que pueden ser utilizadas en procesos de individualización de la HRTF, un modelo paramétrico del módulo de la HRTF y un ajuste por escalado de la Diferencia de Tiempo Interaural (Interaural Time Difference - ITD). En una segunda parte sobre reproducción con altavoces, se han evaluado distintas técnicas como la Síntesis de Campo de Ondas (Wave-Field Synthesis - WFS) o la panoramización por amplitud. Con experimentos perceptuales se han estudiado la capacidad de estos sistemas para producir sensación de distancia y la agudeza espacial con la que podemos percibir las fuentes sonoras si se dividen espectralmente y se reproducen en diferentes posiciones. Las aportaciones de esta investigación pretenden hacer más accesibles estas tecnologías al público en general, dada la demanda de experiencias y dispositivos audiovisuales que proporcionen mayor inmersión. / [CA] La reproducció de les propietats espacials del so és una qüestió cada vegada més important en moltes aplicacions immersives emergents. Ja siga en la reproducció de contingut audiovisual en entorns domèstics o en cines, en sistemes de videoconferència immersius o en sistemes de realitat virtual o augmentada, el so espacial és crucial per a una sensació d'immersió realista. L'audició, més enllà de la física del so, és un fenomen perceptual influenciat per processos cognitius. L'objectiu d'aquesta tesi és contribuir a l'optimització i simplificació dels sistemes de so espacial amb nous mètodes i coneixement, des d'un criteri perceptual de l'experiència auditiva. Aquest treball tracta, en una primera part, alguns aspectes particulars relacionats amb la reproducció espacial binaural del so, com són l'audició amb auriculars i la personalització de la Funció de Transferència Relacionada amb el Cap (Head Related Transfer Function - HRTF). S'ha realitzat un estudi relacionat amb la influència dels auriculars en la percepció de la impressió espacial i la qualitat, dedicant especial atenció als efectes de l'equalització i la consegüent distorsió no lineal. Respecte a la individualització de la HRTF, es presenta una implementació completa d'un sistema de mesura de HRTF i s'inclou un nou mètode per a la mesura de HRTF en sales no anecoiques. A mès, s'han realitzat dos experiments diferents i complementaris que han donat com a resultat dues eines que poden ser utilitzades en processos d'individualització de la HRTF, un model paramètric del mòdul de la HRTF i un ajustament per escala de la Diferencià del Temps Interaural (Interaural Time Difference - ITD). En una segona part relacionada amb la reproducció amb altaveus, s'han avaluat distintes tècniques com la Síntesi de Camp d'Ones (Wave-Field Synthesis - WFS) o la panoramització per amplitud. Amb experiments perceptuals, s'ha estudiat la capacitat d'aquests sistemes per a produir una sensació de distància i l'agudesa espacial amb que podem percebre les fonts sonores, si es divideixen espectralment i es reprodueixen en diferents posicions. Les aportacions d'aquesta investigació volen fer més accessibles aquestes tecnologies al públic en general, degut a la demanda d'experiències i dispositius audiovisuals que proporcionen major immersió. / [EN] The reproduction of the spatial properties of sound is an increasingly important concern in many emerging immersive applications. Whether it is the reproduction of audiovisual content in home environments or in cinemas,
immersive video conferencing systems or virtual or augmented reality systems, spatial sound is crucial for a realistic sense of immersion. Hearing, beyond the physics of sound, is a perceptual phenomenon influenced by
cognitive processes. The objective of this thesis is to contribute with new methods and knowledge to the optimization and simplification of spatial sound systems, from a perceptual approach to the hearing experience. This
dissertation deals in a first part with some particular aspects related to the binaural spatial reproduction of sound, such as listening with headphones and the customization of the Head Related Transfer Function (HRTF). A study has been carried out on the influence of headphones on the perception of spatial impression and quality, with particular attention to the effects of equalization and subsequent non-linear distortion. With regard to the
individualization of the HRTF a complete implementation of a HRTF measurement system is presented, and a new method for the measurement of HRTF in non-anechoic conditions is introduced. In addition, two different and complementary experiments have been carried out resulting in two tools that can be used in HRTF individualization processes, a parametric model of the HRTF magnitude and an Interaural Time Difference (ITD) scaling adjustment. In a second part concerning loudspeaker reproduction, different techniques such as Wave-Field Synthesis (WFS) or amplitude panning have been evaluated. With perceptual experiments it has been studied the capacity of these systems to produce a sensation of distance, and the spatial acuity with which we can perceive the sound sources if they are spectrally split and reproduced in different positions. The contributions of this research are intended to make these technologies more accessible to the general public, given the demand for audiovisual experiences and devices with increasing immersion. / Gutiérrez Parera, P. (2020). Optimization and improvements in spatial sound reproduction systems through perceptual considerations [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/142696
|
32 |
Méthodes de spatialisation sonore et intégration dans le processus de compositionNéron Baribeau, Raphaël 07 1900 (has links)
L’espace est un élément peu exploré en musique. Méconnu des compositeurs, il n’est généralement pas pensé comme paramètre musical « composable ». Pourtant si la musique peut être perçue comme une organisation et une succession d’éléments dans le temps, pourquoi ne pourrait-elle pas l’être aussi dans l’espace?
Ce travail se veut en quelque sorte un pont entre la recherche et la pratique, qui se construit par la synthèse de l’information que j’ai pu trouver sur chacune des quatre méthodes de spatialisation abordées ici. Dans un premier temps, je traiterai de leur développement, leur fonctionnement et des possibilités d’intégration de ces méthodes dans le processus de composition musicale, notamment en discutant les outils disponibles.
Dans un second temps, les pièces Minimale Sédation et Fondations, toutes deux composées en octophonie seront discutées. J’expliquerai leurs processus de composition à travers les intentions, les techniques d’écriture et les outils qui ont menés à leurs créations. / Space is a parameter of sound that is relatively unexplored in music. Misunderstood by composers, it is not generally thought of as "composable" musical parameter. Yet if music can be seen as an organization and a succession of elements in time, why could it not also be in space? This work is intended to somehow bridge the gap between research and practice, by synthesizing the information I could find on each of the four sound spatialization methods discussed here. As a first step, I will discuss their development, operation and integration capabilities in the process of musical composition, as well as the tools available. In a second step, the work Minimale Sédation and Foundations, both composed in eight channels will be discussed. I will explain their process of composition through intentions, writing techniques and tools that have led to their creations.
Keywords
|
33 |
Prédiction objective de l'effet des systèmes tactiques de communication et protection sur les performances de localisation sonore / Objective prediction of the effect of tactical communication and protective systems on sound localization performanceJoubaud, Thomas 15 September 2017 (has links)
Dans de nombreuses situations civiles ou militaires, la protection de l'audition du personnel est cruciale. La perception et l'interprétation de l'environnement sonore par l'auditeur doivent cependant être préservées. Les Systèmes Tactiques de Communication et Protection (TCAPS) sont des protections auditives qui, à la fois, protègent suffisamment les oreilles de l'auditeur contre les bruits dangereux, et préservent l'intelligibilité, permettant ainsi la communication vocale à bas niveau. Des études précédentes ont cependant démontré que les TCAPS continuent de détériorer la perception de l'environnement sonore de l'auditeur, en particulier sa capacité à localiser les sources sonores. Sur le plan horizontal, la dégradation des indices acoustiques empêchant, en temps normal, l'auditeur de confondre les sources avant et arrière, en est la principale explication. Dans ce travail de thèse, une expérience subjective de localisation sonore est conduite avec six TCAPS: deux bouchons d'oreille passifs, deux bouchons d'oreilles actifs et deux casques actifs. Si aucun protecteur ne permet de retrouver les performances de la condition d'écoute normale, l'expérience permet de classifier les TCAPS du point de vue de la localisation sonore: les performances des bouchons passifs sont meilleures que celles des bouchons actifs, et les casques actifs engendrent les plus mauvaises performances. Dans le cadre de la conception et de l'évaluation des TCAPS, une méthode prédisant leur dégradation des performances de localisation sonore, basée sur des mesures électroacoustiques, serait plus adaptée que des expériences comportementales très chronophages. Dans ce contexte, deux méthodes basées sur les Fonctions de Transfert Relatives à la Tête (HRTF) mesurées sur tête artificielle sont étudiées: un processus d'appariement et un réseau de neurones à trois couches. Ils sont optimisés pour reproduire les performances de localisation humaine en condition d'écoute normale. Les méthodes sont ensuite appliquées aux HRTF mesurées avec les six TCAPS, et prédisent des probabilités de localisation en fonction de la position. Comparé aux résultats de l'expérience subjective, le réseau de neurones prédit des performances réalistes avec les bouchons d'oreille, mais surestime les erreurs avec les casques. Le modèle d'appariement prédit correctement les performances de localisation. Toutefois, la vraisemblance de ses distributions de probabilité avec les observations subjectives demeure plus faible que celle du réseau de neurones. Pour finir, les deux méthodes développées dans cette étude sont indépendantes de la tête artificielle utilisée, et peuvent être utilisées pour évaluer non seulement des prototypes de TCAPS, mais aussi des prothèses auditives. / In many civilian or military situations, hearing protection is of major importance. The listener's acoustical situational awareness must however also be preserved. Tactical Communication and Protective Systems (TCAPS) are hearing protection devices that sufficiently protect the listener's ears from hazardous sounds and preserve speech intelligibility, thus allowing low-level speech communication. However, previous studies demonstrated that TCAPS still deteriorate the listener's situational awareness, in particular the ability to locate sound sources. On the horizontal plane, this is mainly explained by the degradation of the acoustical cues normally preventing the listener from making front-back confusions. In the present PhD work, a behavioral sound localization experiment is conducted with six TCAPS: two passive and two active earplugs, and two active earmuffs. The performance in open ear condition is not retrieved with any protector, but the experiment ranks the TCAPS by type: passive earplugs lead to better performance than active earplugs, and active earmuffs induce the worst performance. As part of TCAPS development and assessment, a method predicting the protector-induced degradation of the sound localization capability, and based on electroacoustic measurements, would be more suitable than time-consuming behavioral experiments. In this context, two methods based on Head-Related Transfer Functions (HRTFs) measured on an artificial head are investigated: a template-matching model and a three-layer neural network. They are optimized to fit human sound localization performance in open ear condition. The methods are applied to the HRTFs measured with the six TCAPS, providing position-dependent localization probabilities. Compared with the behavioral results, the neural network predicts realistic performances with earplugs, but overestimates errors with earmuffs. The template-matching model predicts human performance well. However, the likelihood of the resulting probability distributions with the behavioral observations is lower than that of the neural network. Finally, both methods developed in this study are independent of the artificial head used, and can be applied to assess not only TCAPS prototypes, but also hearing aids.
|
34 |
L'individualisation des indices spectraux pour la spatialisation acoustique : étude perceptive de la variabilité inter-individuelle dans les fonctions de transfert relatives à la têteSchönstein, David 12 September 2012 (has links) (PDF)
Cet ensemble de travaux porte sur les effets acoustiques de filtrage de la tête et du corps, ou la fonction de transfert acoustique (HRTF), et son rôle dans la perception des sources sonores dans l'espace. Des méthodes pour créer une illusion auditive haute fidélité, ce qu'on appelle un espace acoustique virtuel, en utilisant l'HRTF sont explorées. Un facteur essentiel pour générer une illusion convaincante est l'utilisation des HRTFs propres à l'auditeur. À cet effet, et dans l'intérêt de produire une solution adaptée pour le marché des consommateurs, une technique permettant de sélectionner un HRTF personnalisé à partir d'une base de données à l'aide d'un ensemble de dimensions de la tête et du corps a été évaluée. La validation a utilisé des jugements perceptifs d'un test d'écoute, et la fiabilité de ces jugements a été analysée. Une étude sur l'impact du type de casque utilisé a également été effectuée.
|
35 |
Measurement and validation of bone-conduction adjustment functions in virtual 3D audio displaysStanley, Raymond M. 06 July 2009 (has links)
Virtual three-dimensional auditory displays (V3DADs) use digital signal processing to deliver sounds (typically through headphones) that seem to originate from specific external spatial locations. This set of studies investigates the delivery of V3DADs through bone-conduction transducers (BCTs) in addition to conventional headphones. Although previous research has shown that spatial separation can be induced through BCTs, some additional signal adjustments are required for optimization of V3DADs, due to the difference in hearing pathways. The present studies tested a bone-conduction adjustment function (BAF) derived from equal-loudness judgments on pure tones whose frequencies were spaced one critical band apart. Localization performance was assessed through conventional air-conduction headphones, BCTs with only transducer correction, and BCTs with a BAF. The results showed that in the elevation plane, the BAF was effective in restoring the spectral cues altered by the bone-conduction pathway. No evidence for increased percept variability or decreased lateralization in the bone-conduction conditions was found. These findings indicate that a V3DAD can be implemented on a BCT and that a BAF will improve performance, but that there is an apparent performance cost that cannot be addressed with BAFs measured using the methodology in the present studies.
|
Page generated in 0.0403 seconds