21 |
Integrative approaches to single cell RNA sequencing analysisJohnson, Travis Steele 21 September 2020 (has links)
No description available.
|
22 |
Exploration of synergistic interactions of oncogenic signals or concurrent driver mutations as novel therapeutic targets to treat AMLZhang, Pu 13 September 2022 (has links)
No description available.
|
23 |
Methods for Analyzing Complex and Multi-conditional Single-cell DataPeidli, Stefan 11 January 2024 (has links)
Über die letzten Jahre haben sich Einzelzelldaten als Trend in der Bioinformatik etabliert, was zu umfangreichen Datensätzen führte. Die Entwicklung von Analysemethoden für solche Daten hat jedoch nicht mit deren Produktion Schritt gehalten. Diese Arbeit befasst sich mit einigen Problemen, die beim Analysieren von Einzelzelldaten auftreten. Das zweite Kapitel enthält eine Analyse von scRNA-seq-Daten von Darmkrebspatienten und Organoiden. Es werden Entwicklungstrajektorien des Darms beschrieben. Anschließend werden Signalgradienten dieser Achsen charakterisiert, insbesondere MAPK- und WNT-Signale. Weiter wird gezeigt, wie RNA velocity basierend auf metabolischen labeling ähnliche Trajektorien in Organoiden aufzeigen kann. Schließlich werden Auswirkungen von Signalwegenhemmung auf die Entwicklungstrajektorien im Detail beschrieben. Das dritte Kapitel bietet einen noch nie dagewesenen Einblick in frühe Stadien von COVID-19 in der Lunge. Verwendete scRNA-seq Daten stammen aus Lungengewebeproben etablierter Hamstermodelle, die mehrere Spezies, SARS-CoV-2-Dosen und Zeitpunkte umfassen, und die ich mit entsprechenden Daten von menschlichen Patienten vergleiche. Für die Analyse zentraler Zelltypen, die den unterschiedlichen Krankheitsverläufen zugrunde liegen, wende ich post-hoc Interpretation auf sonst unzugängliche latent spaces von diffusionmaps an, die neue Einblicke in die zelluläre Pathogenese von COVID-19 bieten. Im letzten Kapitel stelle ich scperturb vor, die größte Sammlung von perturbierten Einzelzelldaten. Ich zeige, wie E-Statistik verwendet werden kann, um solche Daten auf statistisch fundierte Weise zu analysieren. Verzerrungen werden mittels eines neuen Term zur Korrektur der E-Distanz beseitigt. Anschließlich untersuche ich Robustheit der E-Statistiken für einige Analyseszenarien, wie die COVID-19 Daten aus vorherigen Kapitel. Schließlich leite ich Richtlinien für die experimentelle Planung von Einzelzell-Perturbationsstudien mit robuster Statistik ab. / In recent years, single-cell data has emerged as leading trend in bioinformatics, resulting in the generation of substantial datasets. However, development of analysis methods for single-cell data has not kept pace with its production, presenting challenges for analysts. This thesis addresses some of the most pressing issues encountered during the analysis of single-cell data. After a short introductory chapter, the second chapter deals with the problem of arranging single-cell transcriptomes based on biological trajectories, and how these correlate with signaling pathways, specifically those relevant as targets for potential treatments. This thesis demonstrates how RNA velocity based on metabolic labeling can recover similar trajectories in organoids, identifying WNT and MAPK as underlying signaling pathways for development in normal and colon cancer organoids. The third chapter provides an unprecedented view into early stages of COVID-19 in the lungs. For the analysis of key cell types underlying divergent COVID-19 outcomes I apply post-hoc interpretation methods to otherwise inaccessible latent spaces of diffusion maps, revealing new insights into the cellular pathogenesis of COVID-19. Used scRNA-seq data is derived from lung tissue samples of established hamster models, encompassing multiple species, varying SARS-CoV-2 doses, and time points, which I then compare to data from human patients. In the fourth chapter, I present scperturb, the largest collection of single-cell perturbation data. I show how E-statistics can be used to analyze such data in a statistically sound way. After introducing a new bias-correction term to the calculation of E-distances, I investigate the robustness of resulting E-statistics for various analysis scenarios, such as the COVID-19 data from the previous chapter. Finally, I derive guidelines for the experimental design of single-cell perturbation studies such that robust statistics can be achieved.
|
24 |
Modelling and Quantification of scRNA-seq Experiments and the Transcriptome Dynamics of the Cell CycleLaurentino Schwabe, Daniel 26 October 2022 (has links)
In dieser Dissertation modellieren und analysieren wir scRNA-Seq-Daten, um Mechanismen, die biologischen Prozessen zugrunde liegen, zu verstehen
In scRNA-Seq-Experimenten wird biologisches Rauschen mit technischem Rauschen vermischt. Mittels eines vereinfachten scRNA-Seq-Modells leiten wir eine analytische Verteilungsfunktion für die beobachtete Verteilung unter Kenntnis einer Ausgangsverteilung her. Charakteristiken und sogar ein allgemeines Moment der Ausgangsverteilung können aus der beobachteten Verteilung berechnet werden. Unsere Formeln stellen den Ausgangspunkt zur Quantifizierung von Zellvariabilität dar.
Wir haben eine vollständig lineare Analyse von Transkriptomdaten entwickelt, die zeigt, dass sich Zellen während des Zellzyklus auf einer ebenen zirkulären Trajektorie im Transkriptomraum bewegen. In immortalisierten Zelllinien stellen wir fest, dass die Transkriptomdynamiken des Zellzyklus hauptsächlich unabhängig von den Dynamiken anderer Zellprozesse stattfinden. Unser Algorithmus (“Revelio”) bringt eine einfache Methode mit sich, um unsynchronisierte Zellen nach der Zeit zu ordnen und ermöglicht das exakte Entfernen von Zellzykluseffekten. Die Form der Zellzyklus-Trajektorie zeigt, dass der Zellzyklus sich dazu entwickelt hat, Änderungen der transkriptionellen Aktivitäten und der damit verbundenen regulativen Anstrengungen zu minimieren. Dieses Konstruktionsprinzip könnte auch für andere Prozesse relevant sein.
Durch die Verwendung von metabolischer Molekülmarkierung erweitern wir Modelle zur mRNA-Kinetik, um dynamische mRNA-Ratenparameter für Transkription, Splicing und Degradation zu erhalten und die Lösungen auf den Zellzyklus anzuwenden. Wir zeigen, dass unser Modell zwischen Genen mit ähnlicher Genexpression aber unterschiedlicher Genregulation unterscheiden kann. Zwar enthalten scRNA-Seq-Daten aktuell noch zu viel technisches Rauschen, unser Modell wird jedoch für das zukünftige Errechnen von dynamischen mRNA-Ratenparametern von großem Nutzen sein. / In this dissertation, we model and analyse scRNA-seq data to understand mechanisms underlying biological processes.
In scRNA-seq experiments, biological noise gets convoluted with various sources of technical noise. With the help of a simplified scRNA-seq model, we derive an analytical probability distribution function for the observed output distribution given a true input distribution. We find that characteristics and even general moments of the input distribution can be calculated from the output distribution. Our formulas are a starting point for the quantification of cell-to-cell variability.
We developed a fully linear analysis of transcriptome data which reveals that cells move along a planar circular trajectory in transcriptome space during the cell cycle. Additionally, we find in immortalized cell lines that cell cycle transcriptome dynamics occur largely independently from other cellular processes. Our algorithm (“Revelio”) offers a simple method to order unsynchronized cells in time and enables the precise removal of cell cycle effects from the data. The shape of the cell cycle trajectory indicates that the cell cycle has evolved to minimize changes of transcriptional activity and their related regulatory efforts. This design principle may be of relevance to other cellular processes.
By considering metabolic labelling, we extend existing mRNA kinetic models to obtain dynamic mRNA rate parameters for transcription, splicing and degradation and apply our solutions to the cell cycle. We can distinguish genes with similar expression values but different gene regulation strategies. While current scRNA-seq data contains too much technical noise, the model will be of great value for inferring dynamic mRNA rate parameters in future research.
|
25 |
A Machine Learning Model of Perturb-Seq Data for use in Space Flight Gene Expression Profile AnalysisLiam Fitzpatric Johnson (18437556) 27 April 2024 (has links)
<p dir="ltr">The genetic perturbations caused by spaceflight on biological systems tend to have a system-wide effect which is often difficult to deconvolute into individual signals with specific points of origin. Single cell multi-omic data can provide a profile of the perturbational effects but does not necessarily indicate the initial point of interference within a network. The objective of this project is to take advantage of large scale and genome-wide perturbational or Perturb-Seq datasets by using them to pre-train a generalist machine learning model that is capable of predicting the effects of unseen perturbations in new data. Perturb-Seq datasets are large libraries of single cell RNA sequencing data collected from CRISPR knock out screens in cell culture. The advent of generative machine learning algorithms, particularly transformers, make it an ideal time to re-assess large scale data libraries in order to grasp cell and even organism-wide genomic expression motifs. By tailoring an algorithm to learn the downstream effects of the genetic perturbations, we present a pre-trained generalist model capable of predicting the effects of multiple perturbations in combination, locating points of origin for perturbation in new datasets, predicting the effects of known perturbations in new datasets, and annotation of large-scale network motifs. We demonstrate the utility of this model by identifying key perturbational signatures in RNA sequencing data from spaceflown biological samples from the NASA Open Science Data Repository.</p>
|
Page generated in 0.0283 seconds