• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

HÖRFÖRSTÅELSE: EFFEKTER AV TALSYNTES OCH MÄNSKLIGT TAL

Lantz, Morgan January 2018 (has links)
Förmågan att lyssna till en uppläst text, har visat sig vara en komplex uppgift som kräver kognitiva resurser. Några av de kognitiva resurser som krävs för att förstå en uppläst text, är bland annat att en individ har uppmärksamheten riktad mot texten samt att de har ett väl utvecklat ordförråd. För att undersöka om det föreligger någon skillnad i hörförståelse mellan att lyssna på en uppläst text via talsyntes eller mänskligt röst genomfördes en inomgruppsstudie där totalt 13 personer ingick. Av de som ingick var det fyra kvinnor och nio män, mellan 27 och 69 år. Analyserna visade att det inte förekom någon skillnad avseende hörförståelsen för gruppen som helhet samt att inga könsskillnader förelåg. Däremot visade studien att det förekom en relativt stark negativ korrelation mellan ålder och antal rätta svar för texter som var upplästa av talsyntes. Studien indikerar att hörförståelse inte påverkas negativt om en text läses upp av talsyntes jämfört med en mänsklig röst. Men däremot så indikerar studien att äldre personers hörförståelse påverkas i högre grad när de skall lyssna till en text från en talsyntes. / The ability for listening to a text is a complex task that requires cognitive resources. Some of these cognitive resources both attention and well-developed vocabulary. To address whether listening comprehension is affected differently by listening to a text from a synthetic speech and human voice a within-subject designed study was conducted which included 13 participants. Of those 13 participants, four were females, and nine were males ranging between 27 to 69 years of age. The analyses showed that there were no difference in listening comprehension with respect to the whole group and no gender differences. However, there was a relatively strong negative correlation between age and number of correct responses for texts read by a synthetic voice. This study indicates that listening comprehension is not negatively affected when a text is read by synthetic voice compared to a human voice. The study does indicate that older individuals listening comprehension to a more considerable extent are affected when they listen to a synthetic voice compared to a human voice.
2

Kan datorer höra fåglar? / Can Computers Hear Birds?

Movin, Andreas, Jilg, Jonathan January 2019 (has links)
Ljudigenkänning möjliggörs genom spektralanalys, som beräknas av den snabba fouriertransformen (FFT), och har under senare år nått stora genombrott i samband med ökningen av datorprestanda och artificiell intelligens. Tekniken är nu allmänt förekommande, i synnerhet inom bioakustik för identifiering av djurarter, en viktig del av miljöövervakning. Det är fortfarande ett växande vetenskapsområde och särskilt igenkänning av fågelsång som återstår som en svårlöst utmaning. Även de främsta algoritmer i området är långt ifrån felfria. I detta kandidatexamensarbete implementerades och utvärderades enkla algoritmer för att para ihop ljud med en ljuddatabas. En filtreringsmetod utvecklades för att urskilja de karaktäristiska frekvenserna vid fem tidsramar som utgjorde basen för jämförelsen och proceduren för ihopparning. Ljuden som användes var förinspelad fågelsång (koltrast, näktergal, kråka och fiskmås) så väl som egeninspelad mänsklig röst (4 unga svenska män). Våra resultat visar att framgångsgraden normalt är 50–70%, den lägsta var fiskmåsen med 30% för en liten databas och den högsta var koltrasten med 90% för en stor databas. Rösterna var svårare för algoritmen att särskilja, men de hade överlag framgångsgrader mellan 50% och 80%. Dock gav en ökning av databasstorleken generellt inte en ökning av framgångsgraden. Sammanfattningsvis visar detta kandidatexamensarbete konceptbeviset bakom fågelsångigenkänning och illustrerar såväl styrkorna som bristerna av dessa enkla algoritmer som har utvecklats. Algoritmerna gav högre framgångsgrad än slumpen (25%) men det finns ändå utrymme för förbättring eftersom algoritmen vilseleddes av ljud av samma frekvenser. Ytterligare studier behövs för att bedöma den utvecklade algoritmens förmåga att identifiera ännu fler fåglar och röster. / Sound recognition is made possible through spectral analysis, computed by the fast Fourier transform (FFT), and has in recent years made major breakthroughs along with the rise of computational power and artificial intelligence. The technology is now used ubiquitously and in particular in the field of bioacoustics for identification of animal species, an important task for wildlife monitoring. It is still a growing field of science and especially the recognition of bird song which remains a hard-solved challenge. Even state-of-the-art algorithms are far from error-free. In this thesis, simple algorithms to match sounds to a sound database were implemented and assessed. A filtering method was developed to pick out characteristic frequencies at five time frames which were the basis for comparison and the matching procedure. The sounds used were pre-recorded bird songs (blackbird, nightingale, crow and seagull) as well as human voices (4 young Swedish males) that we recorded. Our findings show success rates typically at 50–70%, the lowest being the seagull of 30% for a small database and the highest being the blackbird at 90% for a large database. The voices were more difficult for the algorithms to distinguish, but they still had an overall success rate between 50% and 80%. Furthermore, increasing the database size did not improve success rates in general. In conclusion, this thesis shows the proof of concept and illustrates both the strengths as well as short-comings of the simple algorithms developed. The algorithms gave better success rates than pure chance of 25% but there is room for improvement since the algorithms were easily misled by sounds of the same frequencies. Further research will be needed to assess the devised algorithms' ability to identify even more birds and voices.

Page generated in 0.0448 seconds