Return to search

Sound Quality Prediction Using Neural Networks / Förutsägelse av ljudkvalitet med hjälp av neurala nätverk

Sound quality is an important measure depicting the quality of a machine as well as the comfort in its usage. However, it being a subjective measure, not only is it difficult to capture it ahead of time but also necessitates time and cost expensive jury testing. Thus, it is worthwhile to be able to effectively predict the results of the jury study from metrics that can be objectively measured. The aim of the thesis is twofold: first, to establish neural network models to predict subjective sound quality metrics from objective metrics and second, to interpret the model to understand the relative importance of each objective metric towards a specific subjective rating. Ultimately the thesis aims to pave the way for inclusion of sound quality metrics in the early design stages. From the study, it was evident that neural networks’ performance was at least equal to or better than linear or quadratic models. The connection weights method, the profile method, the perturbation method, the improved stepwise selection method and linear regression method were the interpretation algorithms found to work well in all simulated data-sets. They also gave comparable results on the real data-sets. Neural networks were shown to have the potential for giving low prediction errors while maintaining interpretability in sound quality applications. The data scarcity study gave an idea of the scale of performance enhancement that can be achieved with more data and can act as a useful input for deciding the number data points. / Ljudkvalitet är ett viktigt mått som skildrar en maskins kvalitet såväl som bekvämlighet i dess användning. Det är emellertid ett subjektivt mått, inte bara är det svårt att fånga detta i förväg men också att det kräver både tid och dyra jurytestningar. Det är därför värdefullt att kunna effektivt förutsäga de resultaten av jurystudien från mätvärden som kan mätas objektivt. Syftet med arbetet är tvåfaldigt: det första är att etablera neuronnätsmodeller till att förutsäga subjektiva ljudkvalitetsmätvärden från objektiva mätvärden. Det andra är att tolka modellen till att kunna förstå den relativa betydelsen av varje objektivt mätvärde mot en specifik subjektiv bedömning. I sista hand syftar arbetet till att bana vägen för inkludering av mätvärden för ljudkvalitet i de tidiga designfaserna. Utifrån studien var det uppenbart att neuronnäts prestanda var åtminstone lika med eller bättre än de linjära eller kvadratiska modellerna. Anslutningsviktsmetoden, profilmetoden, störningsmetoden, den förbättrade stegvisa urvalsmetoden samt den linjära regressionsmetoden var tolkningsalgoritmerna som visade sig att fungera väl på alla simulerad datauppsättningar. De gav också jämförbara resultat på de verkliga datauppsättningarna. Neuronnät visade sig att ha potential att ge låga prediktionsfel samtidigt som de bibehåller tolkningsbarhet i applikationer för ljudkvalitet. Studien av dataknapphet gav det en uppfattning om storleken på prestandaförbättring som kan uppnås med mer data och kan fungera som en användbar input vid bestämning av antalet datapunkter.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-283336
Date January 2020
CreatorsKUNTE, DEEPTI SHRIRAM
PublisherKTH, Skolan för industriell teknik och management (ITM)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-ITM-EX ; 2020:547

Page generated in 0.0024 seconds