Return to search

SIARD-transformering av relationsdatabaser : En undersökning av databasarkivering med SIARD-baserad metodik

Detta arbete undersöker hur SIARD-metodik kan användas för arkivering av relationsdatabaser. SIARD är en förkortning av Software Independent Archiving of Relational Databases. SIARD är ett fil-format som är baserad på äldre etablerade standarder som SQL:2008, XML, ZIP64 och UNICODE. SIARD är utvecklat med syfte att kunna hantera långtidsbevarande av relationsdatabaser. Arbetet önskar svara på ifall det finns några datatekniska problem med att använda SIARD-metodik för att transformera en databas till ett SIARD-filformat. Datatekniska mål som undersökts är ifall data och metadata kan gå förlorad eller förändras under databasexportering. Arbetet undersöker också ifall olika normaliseringsgrader påverkar basrelationer eller databasintegritet under exportering eller återskapande av en databas. För att besvara denna frågeställning så har en inledande studie gjorts på arkiverings- och databasverktyg som har stöd för SIARD-metodik. Kravfångst har använts för att finna arbetets begränsningar och sätta upp nåbara delmål för arbetet. I arbetet skapades en testmiljö med en relationsdatabas och testdata som text, heltal, datatyper och standardvärden som kan påverka exporteringsprocessen. Först skapades en testdatabas som sedan arkiverades med SIARD-arkiveringsverktyg. Testdatabasen undersöktes och återskapades sedan för att jämföra de olika databastillstånden och finna skillnader. Resultatet från detta arbete har visat att det är mycket möjligt att data, datatyper, standardvärden och referensintegritet förändras av exporteringsprocessen. Detta kan bero på problemdata eller att SIARD saknar stöd för vissa unika implementationer i databashanterare och frågespråk. I arbetet så analyseras och förklaras de resultat som är framtagna. Några resultat som delas av relaterade studier diskuteras mer ingående. Arbetet sammanfattar att det krävs goda insikter i SIARD-metodik och datakunskap för att inte riskera datatekniska problem som kan uppstå vid databasarkivering. / This work explores how SIARD-methodology can be used for archiving relational databases. SIARD is short for Software Independent Archiving of Relational Databases. SIARD is a file format that is based on older established standards like SQL:2008, XML, ZIP64 and UNICODE. The purpose of SIARD is to handle archiving of relational databases. This work wants to examine if there are some computer technological problems that can arise when using SIARD-methodology to transform a database to a SIARD-format. Computer technological goals that have been examined are if data and metadata loss can occur or be altered during the export process. This work also examines if different normal forms can affect database tables or database integrity during an export or recreation of a database. To answer these questions an initial study was made on the archiving tools and database tools that had support for SIARD-methodology. Requirement capturing has been a key part in finding the limitations of this work and creating reachable milestones for this work. In this work a test environment was created containing a relational database with test data like tupels, datatypes and default values that can affect the export process. The test database was first created then archived with SIARD-tools. The database was examined and then recreated for results comparison between the different database conditions. The result has shown that it is highly possible for data, datatypes, default values and reference integrity to change because of the export process. This can be a result of problematic data or that SIARD lack support for some implementation details that are unique for a database management system or a query language. In this work the results are analyzed and explained. Some results that are shared by related studies are discussed. This work then concludes that sufficient knowledge in computer science and SIARD-methodology is needed to prevent computer technological problems that may arise during database archiving.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:miun-51700
Date January 2024
CreatorsLindblom, Mattias
PublisherMittuniversitetet, Institutionen för data- och elektroteknik (2023-)
Source SetsDiVA Archive at Upsalla University
LanguageSwedish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0013 seconds