Spelling suggestions: "subject:"transkriptom"" "subject:"transkriptomanalyse""
1 |
A computational framework for the comparative analysis of glioma models and patientsCompany Nevado, Juan Carlos 26 June 2023 (has links)
Diffuse Gliome bei Erwachsenen sind aggressive, unheilbare Hirntumore. Humanisierte Mausmodelle helfen, molekulare Mechanismen zu verstehen und therapeutische Ziele zu identifizieren, aber der Vergleich mit Proben von Patienten gestaltet sich schwierig. Ich habe eine computergestützte Plattform namens CAPE entwickelt, um Tumormodelle und Patienten-Expressionsprofile mit Hilfe der nicht-negativen Matrixfaktorisierung zu vergleichen. Die Anwendung von CAPE auf humanisierte Maus-Gliom-Avatar-Modelle (GSA) und diffuse Glioma-Patienten zeigte eine starke Übereinstimmung zwischen den Modellen und dem proneuralen Glioblastom-Subtyp. CAPE hat gezeigt, dass durch die Transplantation der Erwerb neuer Tumorzustände in den Modellen verbessert wurde. Durch die Kombination von reporterbasiertem genetischem Tracing und CAPE zeigte sich, dass eine Untergruppe der in vivo GSA-Populationen mit Patienten zusammenfällt, die astrozytische Merkmale aufweisen. Die Behandlung von GSA-Modellen in vitro mit menschlichem Serum, TNFα oder ionisierender Strahlung führte zu einer Verschiebung in den mesenchymalen Zustand. Einzelzell-Transkriptomik annotierte GSA-Populationen unter verschiedenen Bedingungen und zeigte alle Glioblastomzustände in vivo und bei Aktivierung durch externe Faktoren. Der Vergleich von GSA-Einzelzellpopulationen und Patienten bestätigte diese Identitäten. Die Studie etablierte einen umfassenden Rahmen für die Erprobung und Validierung von Verbesserungen der Tumormodelle, um Patienten besser abzubilden, und erweiterte das Verständnis der Tumorbiologie und Ansprechen auf Therapie. / Adult-type diffuse gliomas are aggressive, incurable adult brain cancers. Humanized mouse models help understand molecular mechanisms and identify therapeutic targets, but comparing them with patient samples is difficult. I developed a computational framework, CAPE, for comparing tumor models and patient expression profiles using non-negative matrix factorization. Applying CAPE to humanized mouse glioma subtype avatar models (GSA) and adult-type diffuse glioma patients revealed a strong resemblance between models and proneural glioblastoma subtype. CAPE showed that transplantation improved new tumor state acquisition in models. Combining genetic tracing reporter phenotypic selection with CAPE showed a subset of in vivo GSA populations clustering with patients having astrocytic-like identities. In vitro treatment of GSA models with human serum, TNFα, or ionizing radiation led to a mesenchymal state shift upon reporter selection. Single-cell transcriptomics annotated GSA populations in different conditions, revealing all glioblastoma states in vivo and upon external factor activation. Comparing GSA single-cell populations and patients confirmed these identities. The study established a comprehensive framework for testing and validating tumor model improvements to resemble patients, advancing tumor biology and treatment response understanding.
|
2 |
Processing and analysis of large scale spatial transcriptomic sequencing dataSztanka-Tóth, Tamás Ryszard 05 August 2024 (has links)
Räumliche Transkriptomik-Sequenzierungstechniken werden bei der Untersuchung von RNA in komplexen Geweben immer populärer. Mit diesen neuartigen Ansätze wird die Häufigkeit von Transkripten unter Beibehaltung ihrer räumlichen Lage gemessen, und ermöglichen so die Untersuchung der Genexpression in einem unvoreingenommen, raumzeitlichen Kontext. Angesichts der Vielfalt der zugrunde liegenden experimentellen Techniken, die Datensätze, die von verschiedenen Transkriptomik-Assays erstellt werden, variieren stark. Diese Datensätze werden von Pipelines verarbeitet und analysiert, die speziell für die jeweilige Methode entwickelt sind. Sie sind weder einfach modifizierbar, noch erweiterbar, dadurch sind sie nicht mit Inputs anderer Technologien kompatibel.
Hier wird spacemake vorgestellt, eine bioinformatische Software, die darauf abzielt, die Lücke zwischen den verschiedenen räumlichen transkriptomischen Sequenzierungsansätzen zu schließen, durch sie einheitliches, schnelles, modulares, reproduzierbares und erweiterbares Rahmenwerk für die Verarbeitung und Analyse groß angelegter räumlicher transkriptomischer Daten bietet. Spacemake verarbeitet erfolgreich Daten aus den neuesten räumlichen Transkriptomik-Assays, unabhängig von ihrer Inputs. Spacemake ist parallel und läuft im Vergleich zu anderen vergleichbaren Techniken schneller. Spacemake ist modular entwickelt, und bietet verschiedene Module wie automatisiertes Clustering und Analyse, Quality Control, Saturation Analyse durch Downsampling, Zusammenführung technischer Replikate, Integration von scRNA-seq-Daten und Alignment von Mikroskopiebildern. Um ein Höchstmaß an Flexibilität zu bieten, ermöglicht spacemake benutzerkonfigurierbare Einstellungen\textit{run-mode} Einstellungen, wodurch die Unterstützung einer breiten Palette experimenteller Designs gewährleistet wird. Da spacemake in Python geschrieben ist, lässt es sich gut mit anderen Computational Biologie Methoden integrieren. Insgesamt hat spacemake das Potenzial, ein wichtiger Bestandteil der räumlichen Transkriptomik-Toolbox der Gegenwart und Zukunft zu sein. / Spatial transcriptomics sequencing techniques are increasingly popular when studying RNA in complex tissues. These novel approaches measure the abundance of transcripts while retaining their spatial location information, thus allowing the study of gene expression in an unbiased, spatiotemporal context. Given the variety of the underlying experimental techniques, the datasets which are produced by each spatial transcriptomic assay also vary greatly. These datasets are processed and analyzed by pipelines tailored specifically for each method, and are not easily modifiable nor extendable, thus making them incompatible to work with inputs from other technologies.
Here spacemake is introduced, a bioinformatic software that aims to close the gap between the various spatial transcriptomic sequencing approaches, by providing a unified, fast, modular, reproducible, and extendable framework for large-scale spatial transcriptomic data processing and analysis. Spacemake successfully processes data from the latest spatial transcriptomics assays, regardless of their input data structure. Spacemake is parallel and runs faster when compared with other similar methods. It has a modular design and offers several modules such as automated clustering and analysis, quality control, saturation analysis through downsampling, technical replicate merging, scRNA-seq data integration, and microscopy image alignment. To offer maximum flexibility, spacemake allows for user-configurable \textit{run-mode} settings, ensuring support for a wide range of experimental designs. Written in Python, spacemake integrates well with other computational biology solutions. Overall spacemake has the potential to be an important part of the spatial transcriptomics toolbox of the present and future.
|
3 |
Detecting and quantifying the translated transcriptome with Ribo-seq dataCalviello, Lorenzo 26 March 2018 (has links)
Die Untersuchung der posttranskriptionellen Genregulation erfordert eine eingehende Kenntnis vieler molekularer Prozesse, die auf RNA wirken, von der Prozessierung im Nukleus bis zur Translation und der Degradation im Zytoplasma. Mit dem Aufkommen von RNA-seq-Technologien können wir nun jeden dieser Schritte mit hohem Durchsatz und Auflösung verfolgen.
Ribosome Profiling (Ribo-seq) ist eine RNA-seq-Technik, die darauf abzielt, die präzise Position von Millionen translatierender Ribosomen zu detektieren, was sich als ein wesentliches Instrument für die Untersuchung der Genregulation erweist. Allerdings ist die Interpretation von Ribo-seq-Profilen über das Transkriptom aufgrund der verrauschten Daten und unserer unvollständigen Kenntnis des translatierten Transkriptoms eine Herausforderung.
In dieser Arbeit präsentiere ich eine Methode, um translatierte Regionen in Ribo-seq-Daten zu erkennen, wobei ein Spektralanalyse verwendet wird, die darauf abzielt, die ribosomale Translokation über die übersetzten Regionen zu erkennen. Die hohe Sensibilität und Spezifität unseres Ansatzes ermöglichten es uns, eine umfassende Darstellung der Translation über das menschlichen und pflanzlichen (Arabidopsis thaliana) Transkriptom zu zeichnen und die Anwesenheit bekannter und neu-identifizierter translatierter Regionen aufzudecken. Evolutionäre Konservierungsanalysen zusammen mit Hinweisen auf Proteinebene lieferten Einblicke in ihre Funktionen, von der Synthese von bisher unbekannter Proteinen einerseits, zu möglichen regulatorischen Rollen andererseits. Darüber hinaus zeigte die Quantifizierung des Ribo-seq-Signals über annotierte Genemodelle die Translation mehrerer Transkripte pro Gen, was die Verbindung zwischen Translations- und RNA-Überwachungsmechanismen offenbarte. Zusammen mit einem Vergleich verschiedener Ribo-seq-Datensätze in menschlichen und planzlichen Zellen umfasst diese Arbeit eine Reihe von Analysestrategien für Ribo-seq-Daten als Fenster in die vielfältigen Funktionen des exprimierten Transkriptoms. / The study of post-transcriptional gene regulation requires in-depth knowledge of multiple molecular processes acting on RNA, from its nuclear processing to translation and decay in the cytoplasm. With the advent of RNA-seq technologies we can now follow each of these steps with high throughput and resolution.
Ribosome profiling (Ribo-seq) is a popular RNA-seq technique, which aims at monitoring the precise positions of millions of translating ribosomes, proving to be an essential tool in studying gene regulation. However, the interpretation of Ribo-seq profiles over the transcriptome is challenging, due to noisy data and to our incomplete knowledge of the translated transcriptome.
In this Thesis, I present a strategy to detect translated regions from Ribo-seq data, using a spectral analysis approach aimed at detecting ribosomal translocation over the translated regions. The high sensitivity and specificity of our approach enabled us to draw a comprehensive map of translation over the human and Arabidopsis thaliana transcriptomes, uncovering the presence of known and novel translated regions. Evolutionary conservation analysis, together with large-scale proteomics evidence, provided insights on their functions, between the synthesis of previously unknown proteins to other possible regulatory roles. Moreover, quantification of Ribo-seq signal over annotated transcript structures exposed translation of multiple transcripts per gene, revealing the link between translation and RNA-surveillance mechanisms. Together with a comparison of different Ribo-seq datasets in human cells and in Arabidopsis thaliana, this work comprises a set of analysis strategies for Ribo-seq data, as a window into the manifold functions of the expressed transcriptome.
|
4 |
Multi-omics insight into the natural history of Type 2 Diabetes in metabolically profiled pancreatectomized donorsBarovic, Marko 09 June 2022 (has links)
Der Typ 2 Diabetes mellitus ist eine chronische Stoffwechselerkrankung; hauptsächlich wird dieser durch das Versagen der Insulin-produzierenden _-Zellen und der gestörten Funktion des Insulin Rezeptors in periphären Geweben definiert. Obwohl die Forschung schon tief in die Geschichte greift und der Inzidenz Anstieg besorgniserregende Tendenzen zeigt, bleiben die pathophysiologische Grundlagen dieser Krankheit unklar. Die Voraussetzung für die Entwicklung des T2D und das zentrale Thema dieser Dissertation – das _-Zellen Versagen – wurde in den letzten Jahrzehnten aktiv erforscht. Viele aktuelle, in gewisen Maße überlappende, Hypothesen wurden aufgestellt, in einem Versuch die biologischen Grundlagen zu erläutern, die zum Versagen der _-Zellen führen und gleichzeitig mögliche Lösungen für dieses Problem zu finden. Während die Hypothesen, die auf den nicht-immunen Zelltentod als Ursache für Zellen Versagen beruhen, durch neue Studien an Zugkraft verlieren, bleiben andere mit ERStress und Dedifferenzierung als Schwerpunkt immer noch relevant. Alle bisher genannten Mechanismen leiden dennoch an geringer Reproduzierbarkeit und herausfordernden Translationsmöglichkeiten. Zudem hat sich die momentan meist genutzte experimentelle Plattform zunehmend als suboptimal erwiesen, denn sie basiert auf Gewinnung von Langerhassche Inseln durch enzymatische Isolierungsverfahren aus Spenderorganen; insbesondere für die Studien die sich methodologisch auf hoch-empfindliche Hochdurchsatzmethoden gründen. Frühere Arbeiten des Solimena-Labors mit Microarray-basierten transkriptomischen Signaturen haben deutlich gezeigt, was seit dem Aufkommen erschwinglicher omics-Methoden in diesem Bereich spekuliert wurde. Es hat sich gezeigt, dass diese hochsensiblen experimentellen Ansätze beeinträchtigt werden, vor allem durch die Verfahren, die zur Isolierung der Inseln aus der gesamten Bauchspeicheldrüse von Spendern erforderlich sind. Die Einführung von Signaturen, die eher ein Produkt des experimentellen Verfahrens als der biologischen Variabilität sind, stellte ein erhebliches Hindernis für die Interpretation der Daten dar, die aufgrund der verworrenen Natur der Auswirkungen der Krankheit auf die Zellbiologie selbst bereits komplex sind. Der Wert der Plattform „Studies of Islets in Living Donors' wurde durch das translationale Potenzial erhöht, das durch die verfügbaren klinischen Daten und die präoperative Erstellung von Stoffwechselprofilen definiert wird, die ansonsten durch den rechtlichen Rahmen für Organspenden stark eingeschränkt sind. In dieser Dissertation wurden LCM-Inseln von lebenden chirurgischen Spendern mit Hilfe von drei Hochdurchsatzmodalitäten profiliert: RNA-Sequenzierung, ungezielte massenspektrometrie-basierte Proteomik und enzymatische Methylierungssequenzierung. Für sich betrachtet, brachte jeder dieser Ansätze neue Erkenntnisse, und im Falle der RNA-Sequenzierung und der Proteomik wurden ausgewählte frühere Ergebnisse bestätigt. Die High-Level-Analyse der Insel-Transkriptome identifizierte eindeutig eine Untergruppe der Proben, die besonders stark mit Betazellen angereichert war, was durch die Dekonvolutionsanalyse bestätigt wurde. Dies ermöglichte vor allem die Identifizierung von differenziell regulierten Genen in den Inselzellen von Patienten mit gerstörten Glukosetoleranz, was einen neuen Einblick in die Entwicklung der Krankheit und nicht nur in die bereits vorhandene Krankheit bietet. Bei der differenziellen Expressionsanalyse wurde eine allgemeine Hochregulierung von Genen festgestellt, während die Gene-Set-Enrichment-Analyse dieser Daten auf Störungen bei Prozessen im Zusammenhang mit dem Energiestoffwechsel, der Translation und extrazellulären Interaktionen hinwies. Die gewichtete Genkorrelationsnetzwerkanalyse identifizierte ein Gen-Koexpressionsmodul, das stark mit der längerfristigen Blutzuckerkontrolle, gemessen durch HbA1c, korreliert. Das Proteom-Profiling deckte eine herausragende Ähnlichkeit zwischen den Proteomen der ND-Inseln und eine bemerkenswerte Streuung der T2D-Proben auf. Die Ergebnisse der differenziellen Abundanzanalyse sowie der anschließenden Anreicherungsanalysen bestätigten weitgehend die Ergebnisse der Transkriptomanalyse, obwohl die Korrelation zwischen den Transkriptomen und Proteomen insgesamt gering war. Dennoch wurden einige der interessanten Targets, die in der Transkriptomanalyse identifiziert wurden, wie z.B. ALDOB oder ACADS, durch die Proteomanalyse bestätigt, wobei zusätzliche Targets neu identifiziert wurden (z.B. CD90). Obwohl die aus den Methylierungssequenzierungsexperimenten gewonnenen Informationen höchstwahrscheinlich aufgrund der relativ geringen Anzahl der untersuchten Personen begrenzt sind, konnten dennoch aussagekräftige Beobachtungen gemacht werden. Das eindeutige Vorherrschen hypomethylierter Regionen in T2D-Inseln unterstützt die durch die anderen Analysen gewonnenen Erkenntnisse und unterstreicht die scheinbar unselektive Lockerung der Zügel bei der Genexpression, die zuvor angenommen wurde. Ausgewählte Targets aus den oben erwähnten bioinformatischen Analysen wurden in vitro untersucht, um ihre Rolle in der Betazellbiologie in T2D zu validieren. Die Überexpression von ALDOB unter in vitro Bedingungen ergab keinen dramatischen Phänotyp, und diese Ergebnisse können bestenfalls als Hinweise auf die Richtung der Stoffwechselstörung in Betazellen in T2D interpretiert werden. Insbesondere scheint die Histonacetylierung in T2D überzeugend verändert zu sein, was möglicherweise auf den veränderten Spiegel von ACADS und/oder seinem Paralogon ACADSB zurückzuführen ist und im Einklang mit der beobachteten allgemeinen Hochregulierung der Genexpression in T2D steht. Wichtig ist, dass Immunfluoreszenzexperimente, bei denen die CD90-Expression vollständig außerhalb des endokrinen Zellbereichs identifiziert wurde, die Bedeutung von Validierungsbemühungen in Verbindung mit omics-Experimenten zur Vermeidung von Interpretationen auf der Grundlage falsch positiver Ergebnisse hervorheben. Schließlich wurden Gewebeschnitte einer Untergruppe von Patienten, die durch RNA-Sequenzierung profiliert worden waren, mit einer maßgeschneiderten Bildanalyse-Pipeline auf das Vorhandensein von Insel-Amyloidose untersucht. Diese Daten wurden mit den klinischen Daten und mit einmalig verfügbaren transkriptomischen Profilen integriert. Sowohl die differentielle Expressionsanalyse als auch die GSEA identifizierten Signaturen, die im Zusammenhang mit der Inselamyloidose von Interesse sind (Zytokinrezeptorinteraktion, Proteintranslation und -verarbeitung). Diese Befunde sind jedoch nur begrenzt spezifisch für die Insel-Amyloidose, da sie meist auch in der Hauptanalyse zum Diabetes-Status zu finden sind. Die Identifizierung von traskriptomischen Veränderungen, die spezifisch für die Inselamyloidose sind und nicht direkt mit der Krankheit selbst zusammenhängen, ist daher mit dem derzeitigen Ansatz fraglich. Nichtsdestotrotz wurde ein Gen-Koexpressionsmodul identifiziert, das in signifikanter, wenn auch schwacher Weise mit der Inselamyloidose korreliert, was für künftige Studien zu dieser Entität spricht.
|
5 |
Transcriptome dynamics in early Drosophila development at tissue and single-cell resolutionWahle, Philipp 14 May 2019 (has links)
Das Nervensystem von Drosophila melanogaster entwickelt sich aus dem Neuroectoderm entlang der anterior-posterioren Axe des Embryos. Dieses Gewebe unterteilt sich in drei Expressionsdomänen, die von ventral nach dorsal durch Expression der drei Homöobox-Transkriptionsfaktoren vnd, ind und msh charakterisiert sind. Vnd und Ind wurden als notwendig und ausreichend beschrieben, um die Zellidentitäten ihrer jeweiligen Gewebe zu determinieren. Um zu untersuchen, wie diese Transkriptionsfaktoren agieren, um ihre jeweiligen Zelltypen hervorzubringen, habe ich die genomweiten Genexpressionsmuster dieser verwandten Gewebe in Wildtyp-Embryos und in einer vnd-Mutante bestimmt. Ich fand heraus, dass anstelle eines Gewebes, das der IC-Domäne ähnelt, die Vnd-Mutante ein Gewebe hervorbringt, das neuronale Charakteristika zum grossen Teil verloren hat. Ich habe gefunden, dass der Transkiptionsfaktor "eyeless" bei ektopischer Expression in der VC den Vnd-Nervensystemphänotyp phänokopiert und ein ähnliches DNA-Bindemuster aufweist wie Vnd. Unsere Daten lassen vermuten, das Vnd sowohl als direkter Aktivator von VC-spezifischen Genen als auch als direkter Repressor von nicht-neuronalen Genen wirkt.
Um die zeitlich-örtliche Auflösung weiter zu erhöhen, habe ich mit Nikolaos Karaiskos kollaboriert, um Einzelzell-Transkriptome von Embryos einer einzigen embryonalen Stufe zu generieren und einen Genexpressions-Atlas des frühen Drosophila-Embryos mit Einzelzellauflösung zu erstellen der die nahezu genomweite Genexpression fast jeder Zelle zu rekapitulieren. Um die Nützlichkeit der Plattform zu demonstrieren, untersuchten wir Expressionsmuster von Genen, die an der Hippo-Signalkaskade beteiligt sind. Wir prognostizierten Hippo-Signalaktivität in bestimmten Bereichen des Embryos und zeigten, dass der Hippo-Signalweg die synchronisierte Zellteilung in diesen Bereichen unterbricht. / The embryonic nervous system of Drosophila melanogaster derives from the neurogenic ectoderm, which is subdivided into three distinct domains. Several key transcription factors show expression exclusive to individual columns and endow their expression domains with characteristic identities. The genes vnd and ind, for example, are homeodomain transcription factors expressed in two columns. Both have been argued to be necessary and sufficient to confer the ventral column or intermediate column fates. To address the question how these transcription factors confer identities to their expression domains I determined the transcriptomic profile of these tissues in wild type and a Vnd mutant embryos. In order to do this, I established a protocol that allowed me to sequence the transcriptomes in developing embryos with spatio-temporal resolution.
I found that upon knockout of Vnd, the ventral column largely looses its neurogenic identity rather than converting its fate, as models would predict. I identified Eyeless as a novel candidate transcription factor that shapes early nerve cord identities. Furthermore the data indicates that in Vnd acts as both, activator and repressor. Excessive co-binding with the GAGA-factor GAF suggests a mechanism by which this activation might be achieved.
To push spatio-temporal resolution towards the single cell level, I collaborated with Nikolaos Karaiskos to extract single cell transcriptomes of a single developmental stage. This has allowed us to establish a digital single-cell resolved transcriptomic map of a single developmental stage. We used this map to predict expression patterns of thousands of genes with striking accuracy.
We identified the Hippo signaling pathway as a spatially regulated pathway in early embryos and showed that it directs the interruption of cell cycle synchronicity in specific areas of the embryo.
|
6 |
Exploring Inter-Species Regulatory Differences Through Single Cell Analysis of Drosophila EmbryogenesisMonaco, Anna Alessandra 09 November 2023 (has links)
Variationen in der Genexpression spielen eine zentrale Rolle bei der evolutionären Divergenz, die zur Speziation führt. Dies wird durch Veränderungen sowohl in nicht-kodierenden cis-wirkenden regulatorischen Elementen (CREs) wie Promotoren und Enhancern als auch in trans-wirkenden regulatorischen Elementen bestimmt. Veränderungen in den regulatorischen Sequenzen können Entwicklungsmuster verändern und wirken als eine der treibenden Kräfte der Evolution der Genexpression. Hier untersuche ich die Anwendung der Einzelzell-Multiomik in der evolutionären vergleichenden Genomik, wobei der Schwerpunkt auf den funktionellen Auswirkungen der Divergenz bei cis-regulatorischen Elementen liegt. Unter Verwendung von Hybrid-Embryonen von Drosophila melanogaster und sechellia generiere ich ein diploides Referenzgenom und führe allelspezifische Einzelzellanalysen von scRNA-seq und scATAC-seq durch. Zusammen können diese beiden komplimentären Ansätze einen integrativen Überblick über die Transkription und die Zugänglichkeit des Chromatins liefern, wodurch CREs identifiziert und mit allelspezifischen Veränderungen in den Genen, die sie regulieren, in Verbindung gebracht werden können. Die computergestützte Rekonstruktion verschiedener Zellidentitäten durch Clustering einzelner Zellen ermöglicht es uns auch zu untersuchen, wie sich das Allel-Ungleichgewicht während der Zelltyp-Spezifikation räumlich verändern kann. Im Gegensatz zu früheren Forschungsarbeiten stelle ich fest, dass Gene, die an der Entwicklung und Musterbildung beteiligt sind, ein unterschiedliches allelisches Ungleichgewicht in der Expression und Zugänglichkeit über die Zelltypen hinweg aufweisen. Diese Arbeit zeigt das Potenzial der Kombination von Einzelzell-Multiomik und artübergreifenden Vergleichen in der vergleichenden Genomik und wirft ein neues Licht auf die Rolle von cis-regulatorischen Elementen in der adaptiven Evolution. / Variation in gene expression plays a pivotal role in the evolutionary divergence that leads to speciation. This is determined by changes in both non-coding cis-acting regulatory elements (CREs) like promoters and enhancers, as well as trans-acting regulatory elements. Changes in regulatory sequences can alter developmental patterns, acting as one of the driving forces behind gene expression evolution. However, poor sequence conservation of CREs makes it challenging to identify them and link changes in regulatory sequences to new phenotypes.
Here, I explore the application of single cell multiomics in evolutionary comparative genomics, with a focus on functional effects of divergence in cis-regulatory elements. Using hybrid embryos of Drosophila melanogaster and Drosophila sechellia, I generate a diploid reference genome and conduct single cell allele-specific analysis of scRNA-seq and scATAC-seq data. Together, these two assays can provide an integrative read-out of transcription and chromatin accessibility, allowing CREs to be identified and linked to allele-specific changes (allelic imbalance) in the genes they regulate. The computational reconstruction of different cell identities via single cell clustering also allows us to investigate how allelic imbalance may vary spatially during cell-type specification.
In contrast to previous research, I find that genes involved in development and patterning display differential allelic imbalance in expression and accessibility across cell types. In addition, I investigate the role of neurodevelopmental allelic imbalance in the sechellia lineage and identify candidate genes for sechellia-specific adaptations.
While highlighting current computational limitations, this thesis demonstrates the potential of combining single cell multiomics and cross-species comparisons in comparative genomics and shedding new light on the role of cis-regulatory elements and mechanisms of adaptive evolution.
|
7 |
Comparative analysis of gene expression associations between mammalian hosts and PlasmodiumMukherjee, Parnika 04 August 2023 (has links)
Artenübergreifende Interaktionen helfen uns, Krankheitsmechanismen zu verstehen und Targets für Therapien zu finden. Die Koexpression von Genen, gemessen an der mRNA-Häufigkeit, kann Interaktionen zwischen Wirt und Pathogen aufzeigen. Die RNA-Sequenzierung von Wirt und Pathogen wird als "duale RNA-Sequenzierung" bezeichnet.
Malaria ist eine der am besten untersuchten parasitären Krankheiten, so dass eine Fülle von RNA-seq-Datensätzen öffentlich zugänglich ist. Die Autoren führen entweder duale RNA-seq durch, um den Wirt und den Parasiten gleichzeitig zu untersuchen, oder sie erhalten kontaminierende Sequenzierungs-Reads aus dem Nicht-Zielorganismus. Ich habe eine Meta-Analyse durchgeführt, bei diese beiden Arten von RNA-seq-Studien verwendet wurden, um über korrelierte Genexpression auf Wirt-Parasit-Interaktionen zu schließen. Ich habe Studien mit Homo sapiens, Mus musculus und Macaca mulatta als Wirte und ihre Plasmodium-Parasiten einbezogen. Ich benutzte orthologe Einzelkopien von Genen, um ein Repertoire von Interaktionen bei Malaria und in diesen Modellsystemen zu erstellen.
Ich verknüpfte die Daten von 63 Plasmodium-Phasen-spezifischen Studien und reduzierte die Zahl der Interaktionen von potenziell 56 Millionen auf eine kleinere, relevantere Menge.
Die Zentralität in den Netzwerken der Blutphasen konnte die Essentialität der Plasmodium-Gene erklären. Das aus den verketteten Daten sagte die Genessenzialität besser vor als die einzelnen Studien - ein Vorteil der Meta-Analyse. Neutrophile und Monozyten Immunmarkergene waren überrepräsentiert, was auf eine Fülle von phagozytären und respiratorischen Reaktionen hindeutet. Die Analyse der Leberphase ergab Wirts- und Parasitenprozesse in frühen und späten Entwicklungsphasen. Ich fand bekannte Wirt-Parasit-Interaktionen, die für beide Phasen gleich sind, sowie bisher unbekannte Interaktionen.
Dieses Prinzip lässt sich auch auf andere Krankheiten anwenden, um Mechanismen und therapeutische Ziele zu verstehen. / Cross-species interactions help us understand disease mechanisms and find targets for therapy. Gene co-expression, measured by mRNA abundance, can identify host-pathogen interactions. The RNA-sequencing of host and pathogen is termed “dual RNA-sequencing”.
Malaria is one of the most studied eukayotic parasitic diseases, making an abundance of RNA-seq data sets publicly available. Authors either perform dual RNA-seq to study the host and parasite simultaneously or acquire contaminant sequencing reads from the non-target organism. I performed a meta-analysis using these two kinds of RNA-seq studies to infer host-parasite interactions using correlated gene expression. I included studies of Homo sapiens, Mus musculus and Macaca mulatta as hosts and their corresponding Plasmodium parasites. I used single-copy orthologous genes to generate a repertoire of interactions in human malaria and in these model systems.
I found 63 malaria RNA-seq studies. I concatenated sequencing runs from Plasmodium stage-specific studies and reduced the number of interactions from a potential 56 million to a smaller, more relevant set.
Centrality in the blood stage networks was able to explain Plasmodium gene essentiality. The network from the concatenated data predicted gene essentiality better than the individual studies, indicating a benefit of the meta-analysis. Immune marker genes for neutrophils and monocytes were over-represented, suggesting an abundance of phagocytic and respiratory burst-related responses. The liver stage analysis revealed linked host and parasite processes at early stages until late developmental stages. I found linked host and parasite processes that are common to the two stages, e.g. parasite cell gliding and invasion and host response to hypoxia and immune response.
I showed that existing data can be explored for new information. This principle can be applied to other diseases to understand mechanisms and therapeutic targets.
|
8 |
Distinguishing activated T regulatory cell and T conventional cells by single-cell technologiesReinhardt, Julia, Sharma, Virag, Stavridou, Antigoni, Lindner, Annett, Reinhardt, Susanne, Petzold, Andreas, Lesche, Mathias, Rost, Fabian, Bonifacio, Ezio, Eugster, Anne 21 May 2024 (has links)
Resting conventional T cells (Tconv) can be distinguished from T regulatory cells (Treg) by the canonical markers FOXP3, CD25 and CD127. However, the expression of these proteins alters after T-cell activation leading to overlap between Tconv and Treg. The objective of this study was to distinguish resting and antigen-responsive T effector (Tconv) and Treg using single-cell technologies. CD4+ Treg and Tconv cells were stimulated with antigen and responsive and non-responsive populations processed for targeted and non-targeted single-cell RNAseq. Machine learning was used to generate a limited set of genes that could distinguish responding and non-responding Treg and Tconv cells and which was used for single-cell multiplex qPCR and to design a flow cytometry panel. Targeted scRNAseq clearly distinguished the four-cell populations. A minimal set of 27 genes was identified by machine learning algorithms to provide discrimination of the four populations at >95% accuracy. In all, 15 of the genes were validated to be differentially expressed by single-cell multiplex qPCR. Discrimination of responding Treg from responding Tconv could be achieved by a flow cytometry strategy that included staining for CD25, CD127, FOXP3, IKZF2, ITGA4, and the novel marker TRIM which was strongly expressed in Tconv and weakly expressed in both responding and non-responding Treg. A minimal set of genes was identified that discriminates responding and non-responding CD4+ Treg and Tconv cells and, which have identified TRIM as a marker to distinguish Treg by flow cytometry.
|
9 |
Exploring adipose tissue through spatial ATAC sequencing / Utforskning av fettvävnad genom rumslig ATAC-sekvenseringLeira Mas, Martí January 2024 (has links)
Fettvävnaden är en viktig regulator för ämnesomsättningen och uppvisar en komplex cellulär arkitektur som påverkar olika fysiologiska och patologiska processer. Dess heterogena natur är relativt ostrukturerad och består huvudsakligen av bräckliga feta adipocyter och immunceller. Dessa komplikationer försvårar studier av mikroarkitekturen - som är avgörande för att förstå dess beteende - vilket nyligen har gynnats av teknik med rumslig upplösning, som möjliggör studier av genomiska profiler samtidigt som informationen från vävnaden bevaras. I detta arbete undersöks kromatindynamiken i fettvävnad med hjälp av den nyutvecklade Spatial Assay for Transposase-Accessible Chromatin med sekvensering med hög genomströmning (Spatial ATAC-seq). Med fokus på subkutan vit fettvävnad samlades prover in från en individ som led av fetma före och fem år efter en bariatrisk operation för att studera förändringar i samband med betydande viktnedgång. Studien omfattar detaljer för både experimentella protokoll och avancerade beräkningsverktyg för dataanalys, inklusive användning av en utvecklingsversion av Semla-paketet för att integrera data om rumslig tillgänglighet och kromatintillgänglighet. Analysen visade på en mångsidig cellulär arkitektur och distinkta genomiska egenskaper i vävnaden, vilket framhävde förekomsten av specifika celltyper som AdipoLEP-liknande adipocyter och infiltrerande immunceller. Denna studie visade att det är möjligt att tillämpa Spatial ATAC-seq för att undersöka de molekylära mekanismerna i fettvävnad som ligger till grund för metabol hälsa och sjukdom, särskilt i samband med fetma och viktminskning. / Adipose tissue is a critical regulator of metabolism, exhibiting a complex cellular architecture that influences various physiological and pathological processes. Its heterogeneous nature is relatively unstructured, mainly formed by fragile fatty adipocytes and immune cells. These intricacies complicate the study of its microarchitecture – crucial for understanding its behaviour – which has recently benefitted from spatially resolved technologies, that enable the study of genomic profiles while keeping the information from the tissue. This work explores the chromatin dynamics of adipose tissue using the newly developed Spatial Assay for Transposase-Accessible Chromatin with high throughput sequencing (Spatial ATAC-seq). Focusing on subcutaneous white adipose tissue, samples were collected from an individual suffering from obesity before and five years after bariatric surgery to study changes associated with significant weight loss. The study comprises details for both experimental protocols and advanced computational tools for data analysis, including the use of a development version of Semla package to integrate spatial and chromatin accessibility data. The analysis revealed a diverse cellular architecture and distinct genomic features across the tissue, highlighting the presence of specific cell types such as AdipoLEP-like adipocytes and infiltrating immune cells. This study demonstrated the feasibility of applying Spatial ATAC-seq in investigating the molecular mechanisms of adipose tissue underlying metabolic health and disease, particularly in the context of obesity and weight loss.
|
10 |
Identifying markers of cell identity from single-cell omics dataVlot, Hendrika Cornelia 12 September 2023 (has links)
Einzelzell-Omics-Daten stehen derzeit im Fokus der Entwicklung computergestützter Methoden in der Molekularbiologie und Genetik. Einzelzellexperimenten lieferen dünnbesetzte, hochdimensionale Daten über zehntausende Gene oder hunderttausende regulatorische Regionen in zehntausenden Zellen. Diese Daten bieten den Forschenden die Möglichkeit, Gene und regulatorische Regionen zu identifizieren, welche die Bestimmung und Aufrechterhaltung der Zellidentität koordinieren. Die gängigste Strategie zur Identifizierung von Zellidentitätsmarkern besteht darin, die Zellen zu clustern und dann Merkmale zu finden, welche die Cluster unterscheiden, wobei davon ausgegangen wird, dass die Zellen innerhalb eines Clusters die gleiche Identität haben. Diese Annahme ist jedoch nicht immer zutreffend, insbesondere nicht für Entwicklungsdaten bei denen sich die Zellen in einem Kontinuum befinden und die Definition von Clustergrenzen biologisch gesehen potenziell willkürlich ist. Daher befasst sich diese Dissertation mit Clustering-unabhängigen Strategien zur Identifizierung von Markern aus Einzelzell-Omics-Daten. Der wichtigste Beitrag dieser Dissertation ist SEMITONES, eine auf linearer Regression basierende Methode zur Identifizierung von Markern. SEMITONES identifiziert (Gruppen von) Markern aus verschiedenen Arten von Einzelzell-Omics-Daten, identifiziert neue Marker und übertrifft bestehende Marker-Identifizierungsansätze. Außerdem ermöglicht die Identifizierung von regulatorischen Markerregionen durch SEMITONES neue Hypothesen über die Regulierung der Genexpression während dem Erwerb der Zellidentität. Schließlich beschreibt die Dissertation einen Ansatz zur Identifizierung neuer Markergene für sehr ähnliche, dennoch underschiedliche neurale Vorlauferzellen im zentralen Nervensystem von Drosphila melanogaster. Ingesamt zeigt die Dissertation, wie Cluster-unabhängige Ansätze zur Aufklärung bisher uncharakterisierter biologischer Phänome aus Einzelzell-Omics-Daten beitragen. / Single-cell omics approaches are the current frontier of computational method development in molecular biology and genetics. A single single-cell experiment provides sparse, high-dimensional data on tens of thousands of genes or hundreds of thousands of regulatory regions (i.e. features) in tens of thousands of cells (i.e. samples). This data provides researchers with an unprecedented opportunity to identify those genes and regulatory regions that determine and coordinate cell identity acquisition and maintenance. The most common strategy for identifying cell identity markers consists of clustering the cells and then identifying differential features between these clusters, assuming that cells within a cluster share the same identity. This assumption is, however, not guaranteed to hold, particularly for developmental data where cells lie along a continuum and inferring cluster boundaries becomes non-trivial and potentially biologically arbitrary. In response, this thesis presents clustering-independent strategies for marker feature identification from single-cell omics data. The primary contribution of this thesis is a linear regression-based method for marker feature identification from single-cell omics data called SEMITONES. SEMITONES can identify markers or marker sets from diverse single-cell omics data types, identifies novel markers, outperforms existing marker identification approaches. The thesis also describes how the identification of marker regulatory regions by SEMITONES enables the generation of novel hypotheses regarding gene regulation during cell identity acquisition. Lastly, the thesis describes the clustering-independent identification of novel marker genes for highly similar yet distinct neural progenitor cells in the Drosophila melanogaster central nervous system. Altogether, the thesis demonstrates how clustering-independent approaches aid the elucidation of yet uncharacterised biological patterns from single cell-omics data.
|
Page generated in 0.0742 seconds