Return to search

Improving Dependability of Space-Cloud Payload Processor by Storage System

Due to the usage of complicated platforms and current high-performance space computing technology, onboard processing in small satellites is expanding. Space-cloud payload processors with Commercial Off-The-Shelf (COTS) components, that are required to be radiation-tolerant, are used to perform the onboard processing. In this thesis, the research will aim to increase the dependability of a generic space-cloud payload processor through its Solid State Drive (SSD) storage unit. To achieve this, a more dependable NAND-flash-based SSD Redundant Array of Independent Disc (RAID) storage system is designed and tested. The reliability of NAND-flash-based SSDs can suffer wear-outs due to increased Program/Erase (P/E) cycles, making them more prone to radiation effects. These radiation effects are considered non-destructive events in the form of bit errors (both single bit-flip and multiple bit-flips). Therefore, making the storage system more dependable involves increasing its reliability against non-destructive events and developing analytical models that account for the considered dynamic of the SSD RAID. The challenge that comes with achieving the aim of this thesis is twofold. First, to explore different RAID levels such that a combination of RAID levels can be incorporated into one SSD for better reliability than a RAID-1 setup. Hence, in this thesis, a RAID array of several SSDs is not considered. Furthermore, the combinations of RAID levels need to account for mixed-critical data. Second, to demonstrate, via simulation and analytical models, the impact on the reliability of the storage system. A comparison study is also undertaken due to the support that the Fourth Extended (Ext4) file system or Zettabyte File System (ZFS) may give to enhance the storage system, and since little research exists that compares the file systems in some feature categories. The solution is a RAID-5 + 6 storage system that is Error Detection And Correction (EDAC) protected by Hamming codes and Reed Solomon (RS) codes. Low-critical data is stored using RAID-5 whereas high-critical data is stored using RAID-6. The simulation of the storage system proves that low-critical stripes of data achieve single fault tolerance whereas high-critical stripes of data tolerate a maximum of 5-bit burst errors. In parallel, several Continuous Time Markov Chain (CTMC) models are analysed, which show that the proposed solution is indeed highly reliable. The comparison study is carried out in a systematic way, and the findings are established as substantial,i.e., ZFS provides greater storage system support. In summary, the results of creating the storage system and analysing it suggest that incorporating RAID-5 and RAID-6 offers better SSD RAID reliability than RAID-1. / Användningen av komplicerade plattformar och aktuell högpresterande rymdberäkningsteknik expanderar onboard-processing i små satelliter. Space-Cloud lösningar med kommersiellt tillgängliga komponenter som är toleranta mot strålningar i rymden används för att utföra onboard-processing. I detta examensarbete syftar forskningen till att förbättra tillförlitligheten hos en generisk rymd dator genom dess SSD-lagringsenhet. För att uppnå detta har ett mer tillförlitligt lagringssystem bestående av NAND-flash och RAID designats och testats. Tillförlitligheten hos NAND-flash-baserade SSD:er kan försämras då dessa kan drabbas av slitage på grund av ökade P/E cykler, vilket gör dem mer benägna för strålningseffekter. Dessa strålningseffekter anses vara icke-destruktiva i form av bit-fel (både enskilda bit-flippar och flera bit-flippar). Med denna anledning görs lagringssystemet mer tillförlitligt för att tolerera icke-destruktiva händelser. Utöver detta, utvecklas analytiska modeller som tar hänsyn till den betraktade dynamiken i SSD RAID. Utmaningen som följer med att uppnå syftet med denna avhandling är tvådelad. För det första, för att utforska olika RAID-nivåer så att en kombination av RAID-nivåer kan inkorporeras i en SSD för bättre tillförlitlighet än RAID-1. Således övervägs inte en RAID-array av flera SSD:er i denna avhandling. Dessutom måste kombinationerna av RAID-nivåer ta hänsyn till data av olika kritikalitet. För det andra, för att genom simulering och analytiska modeller indikera påverkan på lagringssystemets tillförlitlighet. En jämförelsestudie genomförs också på grund av stödet som filsystemen Ext4 eller ZFS kan ge för att förbättra lagringssystemet och eftersom det finns lite forskning som jämför filsystemen i några funktionella kategorier. Lösningen baseras på ett RAID-5+6 lagringssystem som är skyddat av Hamming-koder och RS koder för att upptäcka fel och korrigera dem. Lågkritisk data lagras med RAID-5 medan högkritisk data lagras med RAID-6. Simuleringen av lagringssystemet visar att lågkritiska datasektioner uppnår en fel tolerans mot enskilda bit-flippar medan högkritiska datasektioner kan tåla maximalt 5 bit-flippar. Samtidigt analyseras flera CTMC modeller som visar att den föreslagna lösningen verkligen är mycket tillförlitlig. Jämförelsestudien utförs på ett systematiskt sätt och resultaten fastställs som betydande, det vill säga att ZFS ger större stöd för lagringssystemet. Sammanfattningsvis antyder resultaten av att skapa lagringssystemet och analysera det att inkorporering av RAID-5 och RAID-6 erbjuder bättre tillförlitlighet för SSD RAID än RAID-1.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:mdh-63487
Date January 2023
CreatorsSaid, Hassan, Johansson, Stephanie Liza
PublisherMälardalens universitet, Akademin för innovation, design och teknik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0024 seconds