• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Avgörande faktorer för talnaturlighet hos personer med Parkinsons sjukdom : Korrelationsstudie mellan naiva lyssnares bedömning och akustisk analys / Crtitical Factors for Speech Naturalness in People with Parkinson's Disease. : A Correlational Study between Listener Judgement and Acoustic Analysis.

Larsson, Elias, Isaksson, Fredrik January 2015 (has links)
Tal- och röstförändringar är vanligt förekommande hos personer med Parkinsons sjukdom. Dessa påverkar ofta talarens förståelighet men kan också ha en negativ inverkan på talets naturlighet. Forskning angående vilka faktorer som påverkar talets naturlighet är i dagsläget begränsad, varför föreliggande studie har genomförts. Syftet med studien var att undersöka huruvida den uppfattade talnaturligheten kunde härledas till några specifika tal- och röstparametrar. I föreliggande studie konstruerades ett testbatteri för att elicitera talmaterial från åtta personer med Parkinsons sjukdom. Forskningspersonernas röster spelades in och inspelningarna graderades sedan av 27 naiva lyssnare gällande förståelighet och talnaturlighet. Korrelationstester genomfördes slutligen för att hitta eventuella samband mellan lyssnarnas bedömning och olika akustiska parametrar. Resultatet visade att tal- och artikulationshastighet var den faktor med störst inverkan på lyssnargruppens bedömning av talnaturlighet, där de med långsammast hastighet bedömdes ha mest onaturligt tal. Vidare fanns starka indikationer på att grad av förståelighet korrelerade med bedömningen av talnaturlighet. I föreliggande studie tycktes inga övriga akustiska parametrar ha en statistiskt signifikant korrelation med lyssnargruppens bedömning av talnaturlighet. / Speech and voice changes are common in Parkinson’s disease. These changes can affect the speaker’s intelligibility but can also have a negative impact on the perceived naturalness of speech. The research available regarding the different factors that affect speech naturalness is scarce, which was the motivation behind this study. The aim of the present study was to investigate whether the level of perceived speech naturalness could derive from any specific aspects of speech. This was accomplished by recording speech samples from eight people with Parkinson’s disease using a test battery with various speech tasks. These samples were presented to a group of 27 naive listeners whose task was to judge the level of intelligibility as well as the level of speech naturalness. Correlations were then made between their assessments and various acoustic measurements. The main finding of the present study was that speech and articulation rate seemed to have the greatest impact on the perceived level of naturalness, where the people who had the slowest rate were judged to be the least natural sounding. Furthermore there were strong indications that the level of intelligibility correlated with the level of speech naturalness. In this study there were no other acoustic correlates found with statistical significance.
2

LaMOSNet: Latent Mean-Opinion-Score Network for Non-intrusive Speech Quality Assessment : Deep Neural Network for MOS Prediction / LaMOSNet: Latent Mean-Opinion-Score Network för icke-intrusiv ljudkvalitetsbedömning : Djupt neuralt nätverk för MOS prediktion

Cumlin, Fredrik January 2022 (has links)
Objective non-intrusive speech quality assessment aimed to emulate and correlate with human judgement has received more attention over the years. It is a difficult problem due to three reasons: data scarcity, noisy human judgement, and a potential uneven distribution of bias of mean opinion scores (MOS). In this paper, we introduce the Latent Mean-Opinion-Score Network (LaMOSNet) that leverage on individual judge’s scores to increase the data size, and new ideas to deal with both noisy and biased labels. We introduce a methodology called Optimistic Judge Estimation as a way to reduce bias in MOS in a clear way. We also implement stochastic gradient noise and mean teacher, ideas from noisy image classification, to further deal with noisy and uneven bias distribution of labels. We achieve competitive results on VCC2018 modeling MOS, and state-of-the-art modeling only listener dependent scores. / Objektiv referensfri ljudkvalitétsbedömning ämnad att härma och korrelera med mänsklig bedömning har fått mer uppmärksamhet med åren. Det är ett svårt problem på grund av tre anledningar: brist på data, varians i mänsklig bedömning, och en potentiell ojämn fördelning av bias av medel bedömningsvärde (mean opinion score, MOS). I detta papper introducerar vi Latent Mean-Opinion-Score Network (LaMOSNet) som tar nytta av individuella bedömmares poäng för att öka datastorleken, och nya idéer för att handskas med både varierande och partisk märkning. Jag introducerar en metodologi som kallas Optimistisk bedömmarestimering, ett sätt att minska partiskheten i MOS på ett klart sätt. Jag implementerar också stokastisk gradient variation och medellärare, idéer från opålitlig bild igenkänning, för att ännu mer hantera opålitliga märkningar. Jag får jämförelsebara resultat på VCC2018 när jag modellerar MOS, och state-of-the-art när jag modellerar enbart beömmarnas märkning.

Page generated in 0.0497 seconds