Return to search

Tolka musiktecken från bilder : Optisk musikigenkänning med maskininlärning

The objective of the project was to examine the possibility to use machine lear- ning without prior knowledge of machine learning or of mathematics and if that is possible also explore the possibility to use machine learning to interpret a picture of a piece of sheet music. The capacity of detecting notes from images of sheet music in the produced model was then compared to an existing pro- gram called Audiveris. The result became a model later used in a comparison with the program Audiveris. The comparison resulted in Audiveris finding al- most 100% of the notes but the new model only being able to detect about a third. The reasons for the big difference were probably: first that Audiveris has been in development for many years and secondly that the training data used for the new model wasn’t enough varied and complicated. To further increase the ability of the new model ́s skill the main point would be the need for more trai- ning data at the training of the model. Even then you need to supply a variation in the data ́s content and its degree of difficulty which is more varied then the first training data. / Målet med projektet har varit att undersöka om det går att applicera maskininlärning utan att ha kunskaper av maskininlärning och matematik sedan tidigare samt om detta är möjligt också undersöka om det går att använda maskininlärning för att tolka en bild av nottecken för musik. Detta användes sedan för att jämföra dess förmåga att upptäcka noter med ett redan existerande program kallat Audiveris. Metoden som användes var att bilder märktes med information om dess innehåll och sedan användes dessa bilder för att träna en maskininlärningsmodell att tolka bilder av nottecken. Sedan gjordes en manuell jämförelse av Audiveris resultat samt resultatet från maskininlärningsmodellen efter att den tränats på de nya notbilderna. Resultatet blev en modell som sedan användes vid jämförelsen med Audiveris. Den jämförelsen resulterade i att Audiveris visade sig bättre än den nytränade modellen då Audiveris hittade nästan 100% av noterna på bilden medan den nya modellen bara hittade cirka 33.3%. Orsaken till den stora skillnaden på upptäckande av nottecken berodde antagligen till stor del på två saker: den första att Audiveris utvecklats under många år och den andra att träningsdatat som användes till den nya modellen inte var tillräckligt varierat och komplicerat. För att vidareutveckla den nya modellens färdighet skulle framför allt mer träningsdata behöva användas vid träningsmomentet. Även då behövde man se till att variationen av material och dess svårighetsgrad blev mer varierat än vid grundmaterialet.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:miun-34063
Date January 2018
CreatorsPayerl, Anders
PublisherMittuniversitetet, Avdelningen för informationssystem och -teknologi
Source SetsDiVA Archive at Upsalla University
LanguageSwedish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0921 seconds