• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Classify different types of boat engine sounds with machine learning

Applelid, Gunnar, Karlsson, Mikael January 2019 (has links)
When a boat moves in water, it creates a sound with unique features which makes it possible to identify different boat types or even a specific boat. The ability to identify boats is important in the military sector for surveillance purposes.This thesis describes how different audio processing methods and machine learning approaches are implemented, tested and evaluated in order to create a prototype that identifies boats. A total of 87 boat sounds were used and processed in seven different ways. The machine learning approaches Dense Neural Network, Convolutional Neural Network and Recurrent Neural Network were implemented and trained with the processed audio files in order to identify different boat types. Different combinations of audio processing methods and machine learning approaches ability to classify different boat types, were tested with a stratified Kfold test.The result is a prototype with an audio processing method that divides an audio file to equally large segments. Each segment is converted to a logarithmic mel-scaled spectrogram and a delta feature is calculated and added as an extra dimension for each segment. A Convolutional Neural Network is trained with processed audio files and manages to distinguish different boat types with an accuracy of 75%. / En båt kan identifieras genom att analysera ljudet den skapar när den rör sig i vatten. Förmågan att identifiera båtar är viktig ur övervakningssynpunkt i den militära sektorn. Den här rapporten beskriver hur olika metoder inom ljudanalys och maskininlärning har implementerats, testats och utvärderats för att skapa en prototyp som kan identifiera olika båtar. Totalt 87 olika båtljud användes och behandlades på sju olika sätt.Inom området maskininlärning användes teknikerna ”Dense Neural Network”, ”Convolutional Neural Network” och ”Recurrent Neural Network” som tränades för att identifiera olika båttyper. Olika kombinationer av metoder inom ljudbehandling och maskininlärning testades med ett ”stratified Kfold” test för att utvärdera förmågan att klassificera olika båttyper.Resultatet blev en prototyp med en ljudbehandlingsmetod som delar upp en ljudfil i segment av samma storlek. Varje segment konverteras till ett ”logaritmiskt mel-scaled spectrogram” och en extra dimension med ett deltavärde adderas. Ett ” Convolutional Neural Network” tränas med de behandlade ljudfilerna och lyckas urskilja olika båtklasser med 75% sannolikhet.
2

Kan datorer höra fåglar? / Can Computers Hear Birds?

Movin, Andreas, Jilg, Jonathan January 2019 (has links)
Ljudigenkänning möjliggörs genom spektralanalys, som beräknas av den snabba fouriertransformen (FFT), och har under senare år nått stora genombrott i samband med ökningen av datorprestanda och artificiell intelligens. Tekniken är nu allmänt förekommande, i synnerhet inom bioakustik för identifiering av djurarter, en viktig del av miljöövervakning. Det är fortfarande ett växande vetenskapsområde och särskilt igenkänning av fågelsång som återstår som en svårlöst utmaning. Även de främsta algoritmer i området är långt ifrån felfria. I detta kandidatexamensarbete implementerades och utvärderades enkla algoritmer för att para ihop ljud med en ljuddatabas. En filtreringsmetod utvecklades för att urskilja de karaktäristiska frekvenserna vid fem tidsramar som utgjorde basen för jämförelsen och proceduren för ihopparning. Ljuden som användes var förinspelad fågelsång (koltrast, näktergal, kråka och fiskmås) så väl som egeninspelad mänsklig röst (4 unga svenska män). Våra resultat visar att framgångsgraden normalt är 50–70%, den lägsta var fiskmåsen med 30% för en liten databas och den högsta var koltrasten med 90% för en stor databas. Rösterna var svårare för algoritmen att särskilja, men de hade överlag framgångsgrader mellan 50% och 80%. Dock gav en ökning av databasstorleken generellt inte en ökning av framgångsgraden. Sammanfattningsvis visar detta kandidatexamensarbete konceptbeviset bakom fågelsångigenkänning och illustrerar såväl styrkorna som bristerna av dessa enkla algoritmer som har utvecklats. Algoritmerna gav högre framgångsgrad än slumpen (25%) men det finns ändå utrymme för förbättring eftersom algoritmen vilseleddes av ljud av samma frekvenser. Ytterligare studier behövs för att bedöma den utvecklade algoritmens förmåga att identifiera ännu fler fåglar och röster. / Sound recognition is made possible through spectral analysis, computed by the fast Fourier transform (FFT), and has in recent years made major breakthroughs along with the rise of computational power and artificial intelligence. The technology is now used ubiquitously and in particular in the field of bioacoustics for identification of animal species, an important task for wildlife monitoring. It is still a growing field of science and especially the recognition of bird song which remains a hard-solved challenge. Even state-of-the-art algorithms are far from error-free. In this thesis, simple algorithms to match sounds to a sound database were implemented and assessed. A filtering method was developed to pick out characteristic frequencies at five time frames which were the basis for comparison and the matching procedure. The sounds used were pre-recorded bird songs (blackbird, nightingale, crow and seagull) as well as human voices (4 young Swedish males) that we recorded. Our findings show success rates typically at 50–70%, the lowest being the seagull of 30% for a small database and the highest being the blackbird at 90% for a large database. The voices were more difficult for the algorithms to distinguish, but they still had an overall success rate between 50% and 80%. Furthermore, increasing the database size did not improve success rates in general. In conclusion, this thesis shows the proof of concept and illustrates both the strengths as well as short-comings of the simple algorithms developed. The algorithms gave better success rates than pure chance of 25% but there is room for improvement since the algorithms were easily misled by sounds of the same frequencies. Further research will be needed to assess the devised algorithms' ability to identify even more birds and voices.

Page generated in 0.0563 seconds