Connecting Silos : Automation system for thesis processing in Canvas and DiVA / Anslutande silor : Automatiseringssystem för avhandling i Canvas och DiVA

As the era of digitalization dawns, the need to integrate separate silos into a synchronized connected system is becoming of ever greater significance. This thesis focuses on the Canvas Learning Management System (LMS) and the Digitala vetenskapliga arkive (DiVA) as examples of separate silos. The thesis presents several methods of automating document handling associated with a degree project. It exploits the fact that students will submit their thesis to their examiner via Canvas. Canvas is the LMS platform used by students to submit all their coursework. When the examiner approves the thesis, it will be archived in DiVA and optionally published on DiVA. DiVA is an institutional repository used for research publications and student theses. When manually archiving and publishing student theses on DiVA several fields need to be filled in. These fields provide meta data for the thesis itself. The content of these fields (author, title, keywords, abstract, …) can be used when searching via the DiVA portal. It might not seem like a massive task to enter this meta data for an individual thesis; however, given the number of theses that are submitted every year, this process takes a large amount of time and effort. Moreover, it is important to enter this data correctly, which is difficult when manually doing this task. Therefore, this thesis project seeks to automate this process for future theses. The proposed solution parses PDF documents and uses information from the LMS in order to automatically generate a cover for the thesis and fill in the required DiVA meta data. Additionally, information for inserting an announcement of the student's oral thesis presentation into a calendar system will be provided. Moreover, the data in each case will be checked for correctness and consistency. Manually filling in DiVA fields in order to publish theses has been a quite demanding and time-consuming process. Thus, there is often a delay before a thesis is published on DiVA. Therefore, this thesis project’s goal is to provide KTH with an automated means to handle thesis archiving and publication on DiVA, while doing so more efficiently, and with fewer errors. The correctness of the extracted meta data will be evaluated by comparing the results to the previously entered meta data for theses that have previously been achieved in DiVA. The automated process has been calculated to take roughly 50 seconds to prepare the information needed to publish a thesis to DiVA with ~71% accuracy, compared with 1 hour and 34% accuracy in the previous manual method. / När digitaliseringens tid uppstår, så blir behovet av att integrera separata silor i ett synkroniserat anslutet system större. Denna avhandling fokuserar på Canvas Learning Management System (LMS) och Digitala vetenskapliga arkivet (DiVA) som är exempel på separata silor. Avhandlingen presenterar flera metoder för automatisering av dokumenthantering för examensarbeten. Projektet utnyttjar det faktum att eleverna kommer att skicka sin avhandling till sin examinator via Canvas. Canvas är den LMS-plattform som används av eleverna för att lämna in sitt kursarbete. När examinatorn godkänner avhandlingen kommer den att arkiveras i DiVA och eventuellt publiceras på DiVA. DiVA är ett institutionellt arkiv som används för forskningspublikationer och studentavhandlingar. När man manuellt arkiverar och publicerar studentuppsatser på DiVA måste flera fält fyllas i. Dessa fält ger metadata för själva avhandlingen. Innehållet i dessa fält (författare, titel, nyckelord, abstrakt, ...) kan användas vid sökning via DiVA-portalen. Även om det inte är en stor uppgift att skriva in denna metadata för en individuell uppsats så blir det en mycket tidskrävande process för många examensarbeten. Dessutom är det viktigt att ange dessa uppgifter korrekt, vilket är svårt när man manuellt utför den här uppgiften. Därför syftar detta avhandlingsprojekt till att automatisera denna process för framtida avhandlingar. Lösningen som presenteras i denna avhandling kommer att analysera PDF-dokument och använda annan information från LMS för att automatiskt skapa en fram- och baksida för avhandlingen och fylla i de nödvändiga DiVA-metadata. Grunden för införandet av denna data i ett kalendersystem för att ge ett meddelande om studentens presentation kommer också att ges. Dessutom kontrolleras uppgifterna för korrekthet. Manuell fyllning av DiVA-fält för att publicera avhandlingar har varit en ganska arbetsam och tidskrävande process. Således är det ofta en fördröjning innan en avhandling publiceras på DiVA. Därför ska detta projektet ge KTH ett automatiserat system att hantera avhandlingar och publicering på DiVA, samtidigt som det gör det mer effektivt och med färre fel. Korrektheten hos de extraherade metadatan kommer att utvärderas genom att jämföra resultaten med de tidigare inmatade metadatan för examensarbeten som redan ligger uppe på DiVA.  Den automatiska processen tar ungefär 50 sekunder att förbereda information för att publicera en avhandling till DiVA med ~ 71% noggrannhet jämfört med 1 timme och 34% noggrannhet i tidigare manuell metod.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-230996
Date January 2018
CreatorsBesharat Pour, Shiva, Li, Qi
PublisherKTH, Radio Systems Laboratory (RS Lab)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2018:164

Page generated in 0.003 seconds