Return to search

Benchmarking of computational methods for Spatial Transcriptomics Data analysis / Jämförande analys av beräkningsmetoder för Spatial Transcriptomics data analyser

Ökningen av sekvenseringsdata har skapat ett behov av att ta fram nya och flexibla analysmetoder för att kunna analysera datan. Många sekvenseringsteknologier har utvecklats genom åren, med olika syften och de är idag mer specialiserade. Kostnaden för att sekvensera har även sjunkit kraftigt och idag är kostnaden bara en bråkdel av kostnaden för 20 år sedan.   En av dessa heter Spatial Transcriptomics där mRNA kan analyseras med Spatiell upplösning. Experimenten skapar stora mängder data och analysmetoder som ursprungligen var utvecklade för scRNA-seq har nu ocksp blivit mer specialiserade mot spatial data. En analysmetod som använts länge är Seurat som utvecklades av Satija labbet under 2015. Men de senaste åren har även nya metoder utvecklats. Två av dessa, Giotto och Squidpy kommer att jämföras med Seurat som referens för att reda ut hur bra de presterar för Spatial Transcriptomics analyser. Datan som kommer användas kommer från hjärnvävnad från fyra olika möss som testades i NASAs RR3 mission. Två av mössen är av ”flight” skick och kommer jämföras med två stycken ”ground” kontroller. I data analysen kommer Quality Control, Normalization, Integration, Dimensional reduction, Clustering och Differential Expression analysis testas. Förutom de steg som testas i analysen kommer även parametrar som analysmetodernas flexibilitet, duration och prestation att testas och jämföras. Resultaten i detta projekt visade att Seurat presterar bättre än Giotto och Squidpy utifrån de parametrar som testas. / The increase in data received from sequencing has created a need for new and accurate frameworks to analyze the data. There are many sequencing technologies developed for different purposes. They have become more specialized and the cost compared to 20 years ago is just a fraction. One of the technologies is Spatial Transcriptomics, where mRNA can be analyzed with spatial resolution. The experiments has high throughput, and frameworks that was original developed for scRNA-seq has also started to be more specialised towards spatial data. Seurat has been widely used for that purpose for many years and was developed by the Satija Lab. But many more frameworks have been developed. In this project’s scope, two other frameworks, Giotto and Squidpy, will be benchmarked with Seurat as the golden standard and a referece to examine how the frameworks perform with Spatial Transcriptomics data as input. The dataset consists of four mouse brain tissue sections from the NASA RR3 mission. Two of the mouse brains are of ”flight” condition while the two others are used as ”ground” controls. The pipeline used in all three frameworks includes Quality Control, normalization, integration, dimensional reduction, clustering, and differential expression analysis. Except for the pipeline steps other parameters has been tested including: the flexibility of the frameworks, the duration of analysis, and the performance. The results showed that Seurat outperforms Giotto and Squidpy according to the tested parameters. Mainly because of more developed integration features when working with multiple data. But both Squidpy and Giotto shows great potential and has a lot of features that was not useful for this project, but however can for other projects be very promising.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-321580
Date January 2022
CreatorsTaherpour, Nima
PublisherKTH, Proteinvetenskap
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-CBH-GRU ; 2022:312

Page generated in 0.002 seconds