Return to search

Redução de dimensionalidade usando Isomap aplicada ao áudio espacial / Dimensionality reduction using Isomap applied to spatial audio

Orientadores: Luiz César Martini, Siome Klein Goldenstein / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-26T03:56:26Z (GMT). No. of bitstreams: 1
GrijalvaArevalo_FelipeLeonel_M.pdf: 1718764 bytes, checksum: cfa07a9c26c4179bec4656e94680c0b1 (MD5)
Previous issue date: 2014 / Resumo: Conforme as aplicações de realidade aumentada tornam-se mais relevantes, há um crescente esforço na pesquisa do áudio espacial. O termo áudio espacial refere-se ao conjunto de técnicas onde a anatomia de uma pessoa (i.e. o pavilhão da orelha, a cabeça e o torso) é modelada por meio de filtros digitais. Ao filtrar uma fonte de áudio através desses filtros, o ouvinte é capaz de perceber um som como se ele fosse reproduzido em um local específico no espaço. No domínio da frequência, esses filtros são conhecidos como Funções de Transferência Relativas à Cabeça (Head-Related Transfer Functions, HRTF). Nesta dissertação, estabelecem-se os princípios básicos do áudio espacial, fornecendo uma analise das características espectrais das HRTFs. Além disso, como essas características espectrais diferem de uma pessoa para outra, propõe-se um novo método baseado em antropometria para personalizar HRTFs no plano horizontal. O método usa o Isomap, redes neurais artificias e um procedimento de reconstrução baseado na vizinhança. Assim, modificou-se a construção do grafo do Isomap para ressaltar a individualidade das HRTFs e efetuar uma redução de dimensionalidade não linear das HRTFs. Em seguida, utilizou-se uma rede neural artificial para modelar as relações não lineares entre as características antropométricas e as HRTFs de baixa dimensionalidade. E finalmente, usou-se uma abordagem de reconstrução com base na vizinhança para reconstruir a HRTF a partir do seu equivalente de baixa dimensionalidade. As simulações mostram que a abordagem proposta tem um desempenho melhor do que o PCA (Principal Component Analysis, Analise de Componentes Principais) e confirmam que o Isomap é capaz de descobrir as relações não lineares subjacentes da percepção auditiva / Abstract: As auditory augmented reality applications become more important, there is increasing effort in spatial audio research. The term spatial audio refers to techniques where a person's anatomy (i.e. the pinnae, head and torso) is modeled as digital filters. By filtering a sound source with these filters, a listener is capable of perceiving a sound as though it were reproduced at a specific spatial location. In the frequency domain, these filters are known as Head-Related Transfer Functions (HRTFs). This thesis states the basic principles of spatial audio and provides an analysis of the spectral characteristics of HRTFs. Moreover, since these spectral features differ among individuals, we introduce a new anthropometric-based method for customizing of HRTFs in the horizontal plane. The method uses Isomap, artificial neural networks (ANN), and a neighborhood-based reconstruction procedure. We first modify Isomap's graph construction step to emphasize the individuality of HRTFs and perform a customized nonlinear dimensionality reduction of the HTRFs. We then use an ANN to model the nonlinear relationship between anthropometric features and our low-dimensional HRTFs. Finally, we use a neighborhood-based reconstruction approach to reconstruct the HRTF from the estimated low-dimensional version. Simulations show that our approach performs better than PCA (Principal Component Analysis) and confirm that Isomap is capable of discovering the underlying nonlinear relationships of sound perception / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/259521
Date26 August 2018
CreatorsGrijalva Arévalo, Felipe Leonel, 1984-
ContributorsUNIVERSIDADE ESTADUAL DE CAMPINAS, Goldenstein, Siome Klein, 1972-, Martini, Luiz César, 1952-, Borges, Jose Antonio dos Santos, Iano, Yuzo
Publisher[s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica
Source SetsIBICT Brazilian ETDs
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format52 f. : il., application/pdf
Sourcereponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds