Return to search

Evaluation of an automated formant estimation procedure with optimized formant ceiling / Utvärdering av en automatisk formantmätningsprocedur med optimerat formanttak

This study evaluates an automated formant estimation procedure designed to adapt to speakers and variations in speech. The adaption is achieved by using the formant ceiling with the least variation (in combined estimates of F1 and F2) as the optimal ceiling. This optimization renders the best possible estimations given the data, therefore it could presumably also adapt to variations such as high fo. The procedure has not been evaluated by using material with known formant frequencies. Therefore, this is done here. The performance of the procedure is tested through comparison with a common procedure with fixed ceilings, based on speaker sex. The estimations are carried out on synthetic vowel tokens, systematically varied in formant frequencies and in fo, to match the natural variation within vowels and between speakers. The formant estimations are compared to target values, compared between procedures and to earlier studies. The results reveal that the formant estimation procedure with optimized ceilings does not perform better than the common procedure. Both procedures perform better than earlier methods, but neither deals satisfactorily with high fo. / Denna studie utvärderar en automatisk formantmätningsprocedur utvecklad för anpassning efter talare och variationer i tal. Anpassningen åstadkoms genom att använda det formanttak som uppvisar minst variation (i mätningar av F1 och F2 i kombination) som det optimerade taket. Denna optimering ger bästa möjliga estimeringar utifrån data, därför skulle troligtvis anpassningen även kunna ske till variation såsom hög fo. Proceduren har inte utvärderats genom att använda material med kända formantfrekvenser, varför det görs här. Formantmätningsprocedurens prestation testas genom jämförelse med gängse procedur med fasta formanttak, baserade på skillnader mellan kön. Formantmätningarna utförs på syntetiska vokalexemplar, systematiskt varierade i formantfrekvenser och i fo för att motsvara naturlig variation inom vokaler och mellan talare. Formantmätningarna jämförs mot ursprungsvärdena, procedurerna sinsemellan och med tidigare studier. Resultatet visar att formantmätningsproceduren med optimerat formanttak inte presterar bättre än den gängse proceduren. Båda procedurer presterar bättre än tidigare metoder, men ingen hanterar hög fo på ett tillfredställande sätt.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:su-185197
Date January 2020
CreatorsEricsson, Anna
PublisherStockholms universitet, Institutionen för lingvistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.002 seconds