1 |
The Gunnlod Dataset : Engineering a dataset for multi-modal music generation / Datasetet Gunnlod : Skapandet av ett dataset för skapande av multiinstrumental musikJohansson, Emil, Lindgren, Joel January 2023 (has links)
This report details the creation of a new dataset named the Gunnlod dataset (after the Norse giantess who guarded the mead of poetry) for use in research in the field of machine learning as applied to music creation, particularly multi-modal music in the MIDI format of symbolic music representation. The dataset is based on a subset of approximately four fifths of the Lakh MIDI dataset. Each of the selected files has been processed to create an array representation of the file intended for easy use with machine learning models, as well as a taggram - a matrix of values specifying the degree to which the music exhibits certain traits at different points in time. These traits include genres (such as ”rock”, ”pop” and ”country”), instrumentation (such as ”flute”, ”vocals” and ”guitar”) as well as other more general descriptors (such as ”catchy”, ”quiet” and ”weird”). The trait values are generated by a preexisting machine learning model, circumventing the need for intense human labour. The dataset is intended to enable future researchers to create tools to aid in h‘uman creative tasks, such as a virtual ”composer’s assistant” capable of offering suggestions for melodies or drum beats based on the user’s requests. The code used to create Gunnlod can be found at https://gits-15.sys.kth.se/joeli/midiPipe. The report also includes an ethical analysis of the dataset rooted in the seven guidelines for ethical AI outlined in the framework Ethics guidelines for trustworthy AI commissioned by the European Commission. It concludes that the creation of Gunnlod raises concerns regarding Privacy and data governance and Diversity, non-discrimination and fairness, which are to some degree alleviated by its Transparency, and suggests ways to perform future research in ethical ways. / Denna rapport beskriver skapandet av ett nytt dataset namngivet Gunnlod (efter den jättinna som vaktade skaldemjödet) för bruk inom forskning inom maskininlärning applicerat på musikskapande, med särskilt fokus på multiinstrumental musik på MIDI-format. Datsetet är baserat på cirka fyra femtedelar av Lakh MIDI-datasetet. Varje utvald fil har använts för att skapa en matrisrepresentation därav avsett för enkelt bruk i maskinlärningsmodeller, samt ett taggram - en matris av värden på hur mycket musiken visar på specifika drag vid specifika tidpunkter. Dessa drag inkluderar genrer (såsom ”rock”, ”pop” och ”country”), instrumentation (såsom ”flute”, ”vocals” och ”guitar”) samt mer generellt beskrivande ord (såsom ”catchy”, ”quiet” och ”weird”). Dessa värden genereras av en förexisterande maskininlärningsmodell, vilket kringgår behovet av intensivt mänskligt arbete. Detta dataset är avsett att möjliggöra framtida forskare att skapa verktyg som hjälper människors kreativa processer, såsom en virtuell ”kompositörsassistent” som kan förse förslag på melodier eller trumkomp utifrån en användares förfrågan. Koden som användes för att skapa datasetet går att finna på https://gits-15.sys.kth.se/ joeli/midiPipe. Rapporten innehåller också en etisk analys av datasetet rotad i de sju riktlinjer som ges i ramverket Ethics guidelines for trustworthy AI, skapat på uppdrag av Europeiska kommissionen. Analysen visar på farhågor med Gunnlods skapelse inom områdena Privacy and data governance och Diversity, non-discrimination and fairness, som till viss grad avhjälps av dess höga grad av Transparency, och förslag framläggs på hur framtida forskning ska genomföras på ett etiskt sätt.
Page generated in 0.1869 seconds