Return to search

Resolving metagenomes usingsingle-molecule linked-readsequencing

The development of Massively Parallel Sequencing (MPS) has enabled more accurate and less time-consuming DNA sequencing. Although MPS technologies are theoretically applicable to all samples and species, the majority of studies on microorganisms have been conducted on those able to be isolated and cultivated in laboratories. In the field of metagenomics, DNA from uncultivated environmental samples is analyzed. Whole genome sequencing of such complex samples poses difficult computational challenges due to the characteristics of metagenomic data, where one major challenge lies in determining the true origin of high similarity reads. In addition, the short-range information acquired from MPS reveals little about how reads from DNA sequencing fit together. Consequently, producing genome drafts from reads generated by MPS remains difficult. Here, the linked-read sequencing technology DB-Seq has been applied to bacterial samples in order to assess its potential in metagenomics. Specifically, its performance in retaining long-range information in de novo whole genome assembly has been tested. The results obtained in this initial study show great potential of DB-Seq in genome assembly, with significantly more contiguous results than conventional methods generate. / Utvecklingen av Massiv Parallel Sekvensering (MPS) har möjliggjort mer korrekt och mindre tidskrävande DNA sekvensering. Trots att MPS teoretiskt sett kan appliceras på alla provtyper och arter, har majoriteten av de studier som utförts på mikroorganismer varit fokuserade på de som kan isoleras och odlas i laboratorium. Inom ämnet metagenomik analyseras DNA från orörda miljöprover. Helgenomssekvensering av sådana prover ger upphov till komplicerade utmaningar för data-analys, där ett av de största problemen är att bestämma ursprunget av snarlika sekvenseringsresultat. Ytterligare komplikationer uppstår på grund av den data som erhålls från MPS, då denna ej ger information om hur sekvenseringsdata bör placeras i förhållande till varandra. Följdaktligen är det svårt att producera hopsatta genom utifrån MPS-data. I detta projekt har "linked-read"-sekvenseringsteknologin DB-Seq applicerats på bakterieprover för att undersöka metodens potential i metagenomik. Specifikt har metodens förmåga att bibehålla information om ursprungspositionen av sekvenseringsdata testats i de novo sammansättning av genom. De erhållna resultaten i denna förstagångsstudie tyder på stor potential för DB-Seq i genomsammansättning, med signifikant mer sammanhängande resultatsekvenser än vad konventionella metoder uppvisar.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-231412
Date January 2018
CreatorsTheland, Jennifer
PublisherKTH, Skolan för kemi, bioteknologi och hälsa (CBH)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0205 seconds