• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Stable diffusion for HRIR extrapolation : A novel approach with deep learning / Stabil diffusion för HRIR-extrapolering : Ett nytt sätt med djupinlärning

Rooth, Axel January 2023 (has links)
Humans perceive and interact with their environment through a multitude of sensory channels. Among these, hearing plays a pivotal role, enabling humans to effectively navigate their surroundings. Sound localization, a complex process, relies on the ability of the human brain to distinguish subtle differences between propagated sound waves interacted with the subject's anthropometric features. However, when utilizing headphones in virtual environments, this natural interaction between sound waves and the human subject is altered. To replicate this phenomenon, the acquisition of head-related filters (HR filters) is necessary to transform non-spatial audio into its spatial representation. Unfortunately, the recording process of HR filters is arduous and resource-intensive, resulting in spatial gaps within datasets, particularly in regions above and below the subject, which are more challenging to capture. To address these incomplete HR filters, extrapolation methods must be employed. While distance extrapolation has been previously explored, research on extrapolation techniques for HR filters remains scarce. Hence, this study introduces a novel approach utilizing a pre-trained deep learning model known as Stable Diffusion to efficiently train the model. The results of this innovative technique showcase a remarkable level of precision and fidelity in the extrapolation of head-related filters (HR filters) for both high and low elevations for virtual auditory environments. Through the utilization of the proposed approach, HR filters are successfully extended beyond their original recording boundaries, allowing for an enhanced spatial representation of sound sources situated at varying heights. The extrapolation process not only achieves high levels of accuracy but also ensures the preservation of intricate spatial details, enabling a more immersive and realistic auditory experience for users. These findings signify a significant advancement in the field of virtual acoustics and hold substantial implications for applications such as virtual reality, gaming, and audio engineering. / Människor uppfattar och interagerar med sin omgivning genom en mängd sensoriska kanaler. Bland dessa har hörseln en avgörande roll och möjliggör för människor att effektivt navigera i sin omgivning. Ljudlokalisering, en komplex process, är beroende av människans förmåga att urskilja subtila skillnader mellan interagerande ljudvågor med människans antropometriska särdrag. När dock hörlurar används i virtuella miljöer förändras denna naturliga interaktion mellan ljudvågor och människan. För att replikera detta fenomen behövs insamling av huvudrelaterade filter (HR-filter) för att omvandla icke-spatialt ljud till dess spatiala representation. Tyvärr är inspelningsprocessen för HR-filter besvärlig och resurskrävande, vilket resulterar i spatiala luckor inom datamängder, särskilt i områden över och under subjektet som är svårare att fånga. För att åtgärda dessa ofullständiga HR-filter måste extrapolationsmetoder användas. Medan avståndsextrapolation tidigare har undersökts är forskningen kring extrapolationstekniker för HR-filter knapphändig. Därför presenterar denna studie ett nytt tillvägagångssätt som utnyttjar en förtränad djupinlärningsmodell kallad Stable Diffusion för att effektivt träna modellen. Resultaten från denna innovativa teknik visar en anmärkningsvärd precision och noggrannhet vid extrapoleringen av huvudrelaterade filter (HR-filter) för både höga och låga höjdpositioner för virtuella ljudmiljöer. Genom användning av det föreslagna tillvägagångssättet kan HR-filter framgångsrikt förlängas utanför sina ursprungliga inspelningsgränser, vilket möjliggör en förbättrad spatial representation av ljudkällor som är placerade på olika höjder. Extrapolationsprocessen uppnår inte bara hög noggrannhet utan säkerställer också bevarandet av intrikata spatiala detaljer, vilket möjliggör en mer immersiv och realistisk ljudupplevelse för användarna. Dessa resultat innebär en betydande framsteg inom området virtuell akustik och har väsentliga implikationer för tillämpningar såsom virtuell verklighet, spel och ljudteknik.

Page generated in 0.1044 seconds