• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 12
  • 1
  • 1
  • Tagged with
  • 13
  • 13
  • 12
  • 10
  • 8
  • 7
  • 5
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Sequencing of serum hepatitis B virus (HBV) RNA as a novel method for the genome analysis of HBV

Schmalbrock, Laura Katharina 04 January 2018 (has links)
The genome of hepatitis B virus (HBV) can be assessed by sequence analysis of HBV DNA in serum. In most chronic HBV infected patients treated with potent nucleos(t)ide analogues (NAs) this approach however is limited by the fast decrease of serum HBV DNA during NA treatment. In contrast, HBV RNA was shown to persist in serum of some HBV infected individuals receiving NA treatment. In this study, we established the sequencing of serum HBV RNA as a method for the monitoring of HBV variants during NA treatment after the decrease of serum HBV DNA to undetectable levels. Using this approach, we studied the evolution of HBV variants in follow-up serum samples (n=156) of 25 patients treated with the potent polymerase inhibitor tenofovir (TDF) as second or third-line treatment. In our cohort, specific reverse transcribed full-length and truncated HBV RNA remained detectable with real-time PCR for long periods in most serum samples, also after the decline of HBV DNA during treatment with TDF. The HBV genome could be analyzed based on serum HBV DNA sequencing in 61 serum samples for a mean duration of 6.0 ± 4.5 (0 – 13) months. After this, sequencing of reverse transcribed serum HBV RNA allowed the analysis of the HBV genome for an additional mean duration of 33.9 ± 12.7 (16 - 65) months in 68 serum samples. The comparison of serum HBV DNA and serum HBV RNA derived sequences showed a high homology. In most patients, acquired HBV resistance variants in the reverse transcriptase (rt) region of the polymerase gene were detectable on HBV DNA and HBV RNA basis. Serum HBV RNA sequencing further revealed a long persistence of these variants during TDF treatment (mean duration of 26.5 ± 15.8 (0 – 50) months), which indicates a high conservation in the cccDNA of the infected individuals. Also HBV stop mutations in the small surface (s) gene, which were discussed in the pathogenesis of hepatocellular carcinoma (HCC), were present at baseline in 5 patients and remained detectable on HBV RNA basis during follow-up. In this study, we demonstrated that sequencing of reverse transcribed HBV RNA from patient serum is a suitable method to assess HBV variants during NA treatment. We further provided insights into the evolution of HBV variants during strong suppression of the viral replication with the polymerase inhibitor TDF. Future studies should investigate more comprehensively the clinical application of the here presented method of serum HBV RNA sequencing for the early detection of resistant HBV variants during NA treatment and the observation of HBV s gene variants related to HCC development.:Table of content I Table of content 3 II Abbreviations 6 1 Introduction 10 1.1 HBV 11 1.1.1 Classification 11 1.1.2 HBV virion structure and genomic organization 11 1.1.3 HBV proteins 12 1.1.4 HBV replication cycle 15 1.2 Chronic HBV infection 17 1.2.1 Epidemiology 17 1.2.2 Natural course of chronic HBV infection 17 1.3 Treatment of chronic HBV infection with nucleos(t)ide analogues 18 1.3.1 Nucleos(t)ide analogues 18 1.3.2 Treatment goals 18 1.3.3 Response to nucleos(t)ide analogue treatment 20 1.3.4 Treatment with nucleos(t)ide analogues and liver disease 21 1.4 Evolution of HBV variants during antiviral treatment 22 1.4.1 HBV resistance mutations in the pol gene 22 1.4.2 Resistance rates to treatment with nucleos(t)ide analogues 25 1.4.3 HBV variants in the s gene 26 1.5 HBV RNA in serum of chronically infected patients 29 1.5.1 HBV RNA molecules 29 1.5.2 HBV RNA packaging and release 29 1.5.3 HBV RNA as serum marker 31 1.6 Aim of the study 31 2 Materials and methods 33 2.1 Materials 33 2.1.1 Chemicals 33 2.1.2 Devices 33 2.1.3 Laboratory materials 34 2.1.4 Cycler 34 2.1.5 Kits 35 2.1.6 Buffers and solutions 36 2.1.7 Primers 36 2.1.8 Data analysis 39 2.2 Methods 39 2.2.1 Patient set and sample selection 39 2.2.2 Extraction of nucleic acids from serum samples 40 2.2.3 Reverse transcription of HBV RNA 40 2.2.4 Quantification of HBV serum DNA and HBV RNA by real-time PCR 41 2.2.4.1 Real-time PCR 41 2.2.4.2 Quantification of serum HBV DNA 43 2.2.4.3 Quantification of serum HBV trRNA and HBV flRNA 45 2.2.5 Sequencing of serum HBV DNA and HBV RNA 47 2.2.5.1 Primer design 47 2.2.5.2 Amplification by PCR 48 2.2.5.3 Purification of amplification products 50 2.2.5.4 Sanger sequencing of PCR fragments 51 2.2.6 Quantification of serum HBsAg and HBeAg 53 2.2.7 Cloning of HBV variants 53 2.2.8 Data analysis 55 2.2.8.1 Serum HBV DNA and HBV RNA quantities 55 2.2.8.2 Analysis of HBV DNA and HBV RNA sequences 55 3 Results 59 3.1 Composition of the patient set 59 3.2 Quantification of HBV DNA and HBV RNA in serum samples 59 3.2.1 Quantitative courses of serum HBV DNA 60 3.2.2 Quantitative courses of serum HBV flRNA and HBV trRNA 61 3.3 Sequencing of HBV DNA and HBV RNA 64 3.3.1 Method 64 3.3.2 Follow-up with sequencing of HBV DNA and HBV RNA 67 3.3.3 Genotyping of baseline samples 67 3.4 Evolution of HBV variants in the rt region 68 3.4.1 HBV resistance mutations in the rt region at baseline 68 3.4.2 HBV resistance mutations in the rt region during antiviral treatment 70 3.5 HBV variants in the s gene 77 3.5.1 HBV s gene variants at baseline 77 3.5.2 HBV s gene variants during antiviral treatment 80 4 Discussion 82 4.1 Patient cohort 82 4.2 Quantification of serum HBV DNA, HBV flRNA and HBV trRNA 82 4.3 Quantitative courses of serum HBV DNA, HBV flRNA and HBV trRNA 83 4.4 Sequencing of serum HBV RNA as novel method for HBV genome analysis 85 4.5 Evolution of HBV variants in the rt region 89 4.6 Evolution of HBV stop mutations in the s gene 91 4.7 Conclusion 92 III Summary 94 IV References 96 V List of Figures 104 VI List of Tables 105 VII Supplement 106 VIII Erklärung über die eigenständige Abfassung der Arbeit 107 IX Curriculum Vitae 108 X Publications 110 XI Acknowledgment 114
2

Organotypische Schnittkulturen aus Glioblastomgewebe als präklinisches Testsystem

Hähnel, Susann 03 February 2023 (has links)
Glioblastoma multiforme (GBM) ist der häufigste bösartige Hirntumor bei Erwachsenen. Unbehandelt liegt das mediane Überleben bei circa drei Monaten. Mithilfe maximal möglicher Resektion des Tumors und anschließender aggressiver kombinierter Radiochemotherapie, bestehend aus Bestrahlung und dem Zytostatikum Temozolomid, wird das mediane Überleben auf circa 15 Monate nach Diagnosestellung angehoben. Trotz intensiver Forschung ist über die Entstehung des GBMs wenig bekannt, der einzige bisher bestätigte prädisponierende Faktor ist eine Bestrahlung des Kopfes, insbesondere im Kindes- und Jugendalter. Ein charakteristisches Merkmal des GBMs ist seine große Heterogenität sowohl innerhalb des Tumors eines Patienten als auch zwischen den Tumoren verschiedener Patienten. Dadurch werden die erfolgreiche Behandlung und eine mögliche Heilung erschwert, da sich bis heute nicht zuverlässig vorhersagen lässt, wie gut ein Patient von der Standardtherapie profitieren wird. Das infiltrative Wachstum von GBMs entlang von Nervenbahnen in der gesunden weißen Substanz oder mithilfe der Blutgefäße macht es nahezu unmöglich, die gesamte Tumormasse chirurgisch zu entfernen, was eine hohe Rezidivrate zur Folge hat. Ein größeres Verständnis für die Entstehungsmechanismen des GBMs und seiner Therapieresistenzen ist essenziell für die Entwicklung besserer Therapiemöglichkeiten und verlangt dringend nach geeigneten Modellen für deren Erforschung. In der Krebsforschung bedient man sich häufig an Zellkultur- oder Tiermodellen. Zellkulturen bieten den Vorteil, dass sie preisgünstig in der Unterhaltung sind und sich in relativ kurzer Zeit große Datenmengen durch einen hohen experimentellen Durchsatz erzielen lassen. Nachteilig ist, dass jeglicher Gewebeverband fehlt und das Modell daher nicht die reale Situation in einem ganzheitlichen Organismus widerspiegelt. Im Tiermodell ist der Organismus mitsamt verschiedenen Zelltypen, extrazellulärer Matrix und Blutkreislauf gegeben, jedoch gibt es mitunter gravierende Interspeziesunterschiede, die eine erfolgreiche klinische Translation der Ergebnisse aus Tierversuchen in das humane System erschweren. Patient-derived xenografts, also Transplantate aus Patientengewebe, machen sich den Organismus des Versuchstieres zunutze, erhalten aber dabei auch die Charakteristik des ursprünglichen Tumors weitgehend. Um eine Abstoßung des transplantierten Tumorgewebes zu verhindern, werden zumeist immundefiziente Tiere verwendet, bei denen die immunologische Komponente fehlt, was das Modell artifizieller macht. Zudem ist das erzeugte Tierleid ein nicht zu unterschätzender Faktor, denn Überlebenszeitanalysen mit dem Tod des Versuchstieres als Endpunkt, spielen eine wesentliche Rolle in der onkologischen Forschung. Um das Tierleid in wissenschaftlichen Experimenten zu verringern, wurde 1959 erstmals das 3R-Prinzip (Reduction, Replacement, Refinement) definiert, wonach Tierversuche möglichst komplett ersetzt, Tierzahlen reduziert und die Bedingungen für Versuchstiere verbessert werden sollen. Diesem Prinzip folgend wurden im Institut für Anatomie der Universität Leipzig die organotypischen Schnittkulturen aus Patientengewebe als Alternative zum Tierversuch etabliert. Hierbei wird operativ entnommenes Tumorgewebe von Patienten mithilfe eines Tissue Choppers in 350 µm dünne Scheiben geschnitten und auf Membranen an einer Luft-Medium-Grenze kultiviert. Gewebe aus humanem GBM kann auf diese Weise bis zu zwei Wochen vital erhalten und für Versuche verwendet werden. In der hier vorliegenden Promotionsarbeit wurden Schnittkulturen aus GBM-Gewebe von 25 Patienten angelegt und der Standardbehandlung aus Temozolomid und Bestrahlung unterzogen. Anschließend wurde das Gewebe histologisch aufgearbeitet, um einerseits die Qualität des Gewebeerhalts mittels klassischer Färbungen mit Hämatoxylin und Eosin beurteilen und um andererseits Marker für Proliferation (Ki67) und Apoptose (TUNEL-Assay) anfärben und quantifizieren zu können. In der Vergangenheit beschränkte sich die Auswertung solcher Färbungen vorrangig auf die manuelle Quantifizierung, was zeitintensiv und abhängig von der durchführenden Person zu abweichenden Ergebnissen führt. Im Rahmen dieser Arbeit gelang die automatisierte quantitative Auswertung histologischer Färbungen von kultivierten Gewebeschnitten und deren Veröffentlichung. Durch die Automatisierung kann die Analyse deutlich schneller erfolgen, ist objektiver und damit auch geeigneter für eine klinische Anwendung. Zusätzlich zur histologischen Aufarbeitung des Gewebes wurde aus den Schnittkulturen RNA extrahiert, um Behandlungseffekte auf Expressionsebene untersuchen zu können. Für einen Patienten gelang der Vergleich zwischen Tumorgewebe und angrenzendem Tumorzugangsgewebe, da von beiden Gewebetypen Schnittkulturen angelegt und die Behandlung durchgeführt werden konnte. Mit einer Sequenziertiefe von bis zu 368 Millionen Reads pro Probe, wurden 1888 Gene identifiziert, die im Vergleich zum angrenzendem Gewebe im Tumorgewebe signifikant herunterreguliert waren. Fast 2400 Gene waren entsprechend hochreguliert. Zwischen behandeltem und unbehandeltem Tumorgewebe gab es über 3400 Transkripte, die signifikant unterschiedlich exprimiert wurden. Die Signalweganalyse mit der IPA Software (Qiagen) ergab eine reduzierte Proliferation in behandeltem GBM-Gewebe, was sich mit den Befunden aus der Quantifizierung der Ki67-Färbung deckte. Eine Subgruppenanalyse ergab, dass Gewebekulturen von langzeitüberlebenden Patienten (Gesamtüberleben > 24 Monate) besser auf die Behandlung anzusprechen scheinen, was sich in einer signifikant erhöhten Apoptoserate im Vergleich zu Patienten mit kurzem Überleben zeigte. Schnittkulturen aus Patienten mit einem progressionsfreien Überleben (PFS) von mehr als 7 oder 12 Monaten zeigten eine signifikant höhere Proliferation als Patienten mit einem PFS von unter 7 Monaten. Begründbar ist das mit einer höheren Suszeptibilität von proliferierendem Gewebe gegenüber Schäden durch Bestrahlung und Zytostatika. Die Expressionsanalyse aller 25 Patientenproben ergab eine Hochregulierung von 58 proteinkodierenden Genen. 32 Gene waren im Vergleich zu den unbehandelten Kontrollen im behandelten Gewebe herunterreguliert. Durch die funktionelle Analyse dieser differentiell exprimierten Gene konnte gezeigt werden, dass der p53-Signalweg, die Zellzykluskontrolle, sowie mit DNA-Schäden und deren Reparatur assoziierte Gene und Signalwege nach der Behandlung vermehrt aktiviert sind. Insgesamt zeigen die Ergebnisse der vorliegenden Arbeit, dass Schnittkulturen aus GBM-Gewebe nicht nur histologisch aufgearbeitet werden können, sondern dass es zudem möglich ist, weitreichende molekulare Untersuchungen und Genexpressionsanalysen erfolgreich durchzuführen. Weiterhin sieht man eine gute Korrelation der aus den Kulturen gewonnenen Ergebnisse mit dem klinischen Verlauf der jeweiligen Patienten, was den Rückschluss zulässt, dass die Schnittkulturen ein gutes Abbild der tatsächlichen Situation im Patienten darstellen. Damit wird die Nutzbarkeit des Modells als Alternative zum Tierversuch weiter erhöht und klinisch interessant. Die Robustheit der Methode zeigt sich dadurch, dass RNA-Analysen aus den 25 Patienten umgesetzt werden konnten, obwohl es zum Teil gravierende Unterschiede in der Qualität des kultivierten Gewebes gab. Die inter- und intratumorale Heterogenität des GBMs stellt eine große Herausforderung dar, die mit der Verwendung von biologischen und technischen Replikaten adressiert wurden. Die Korrelationsanalyse der einzelnen Replikate zeigte, dass zumindest die intratumorale Heterogenität weitgehend ausgeglichen werden konnte. Die Heterogenität zwischen den einzelnen Patienten blieb jedoch erhalten und erschwerte allgemeine Aussagen und generelle Rückschlüsse. Auch im GBM besteht daher der dringende Bedarf an individualisierten und auf den einzelnen Patienten ausgerichteten Therapieansätzen. Hierfür bedarf es zukünftig weiterer Forschung an potenziellen Biomarkern mit größeren Patientenkohorten. Gewebekulturen können hierfür sowohl für die Untersuchung von Patientengewebe als auch für die Testung neuartiger Therapieansätze eine Rolle spielen.:Einleitung 3 Glioblastoma multiforme 3 Standardtherapie und MGMT 4 Immuntherapie 5 Heterogenität im GBM 6 Individualisierte Therapie 7 RNA-Sequenzierung 8 Modelle in der Krebsforschung 10 Schnittkulturen aus Patientengewebe 11 Zielstellung der Arbeit 13 Publikation I 14 Publikation II 33 Zusammenfassung 63 Referenzen 66 Darstellung des eigenen Beitrags 72 Erklärung über die eigenständige Abfassung der Arbeit 76 Lebenslauf 77 Publikationen 78 Vorträge 78 Danksagung 79
3

Charakterisierung induzierter, kolorektaler Lebermetastasen in einem Mausmodell und Einfluss von Makrophagenphänotypen auf die Tumorprogression / Characterization of colorectal cancer induced liver metastases and the impact of macrophage phenotypes on tumor progression

Bocuk, Derya 21 December 2016 (has links)
Die Leber nimmt als Hauptzielorgan des metastasierenden Kolorektalkarzinoms (CRC) eine exponierte Rolle ein; bei mehr als 50 % der betroffenen Patienten werden im Laufe ihrer Tumorerkrankung Lebermetastasen diagnostiziert, die trotz multimodaler Therapiekonzepte immer noch den fatalen Kranksheitsverlauf bestimmen. Zwecks Entwicklung neuer Therapiestrategien ist ein fundiertes Verständnis der Entstehungsmechanismen und des Genexpressionsprofils der Metastasen erforderlich. Makrophagen wird in diesem Kontext ein großer Einfluss auf die Tumorentstehung und -progression zugeschrieben, weshalb von einer klinischen Relevanz der Makrophagenpolarisation auszugehen ist. Im Rahmen der vorliegenden Arbeit wurde mit der CRC Zelllinie CMT-93 ein syngenes, orthotopes Lebermetastasenmodell in C57BL/6N Mäusen etabliert. Basierend auf RNA Sequenzierungsdaten und bioinformatischen Analysemethoden wurde eine Entwicklung und fein abgestimmte Adaptation der CMT-93 Zellen im Zuge ihrer Propagation im hepatischen Milieu nachgewiesen. Diese resultierte in divergierenden Genexpressionsprofilen zwischen Zelllinie und Metastasen. Von insgesamt 3329 differentiell exprimierten Genen wurden mittels einer Selektionsliste 32 signifikant exprimierte Gene identifiziert. Insbesondere Matrix-Metalloproteasen (MMP-2, -7, -9), Chemokinrezeptoren (CXCR2, CXCR4), Zelladhäsionsgene (ITGA6, ITGB3) sowie Wif1 als Feinregulator des kanonischen Wnt Signalweges nehmen eine bedeutende Rolle ein und tragen zum Invasions- und Metastasierungsprofil von CMT-93 Zellen unter dem Einfluss des Lebermilieus bei. Invasive und aggressive Eigenschaften der CMT-93 induzierten Lebermetastasen wurden insbesondere im frühen und späten Metastasierungsstadium nachgewiesen. Hier wurde u.a. die Expression der EMT Marker Vimentin, MMP-7 und CD44, Ki-67, NFkb1 und Stat3 untersucht. Eine Gene Ontology Analyse und RNA Sequenzierungsdaten verschiedener Leberareale zeigten, dass die vielschichtige Interaktion zwischen CMT-93 Zellen und der hepatischen Mikroumgebung u.a. durch immunregulatorische Prozesse gesteuert wird, die in veränderten Genexpressionsprofilen zwischen Zelllinie, Metastase und tumorumgebendem Gewebe resultiert. In Lebermetastasen konnte eine Mischpopulation aus M1 und M2 Makrophagen nachgewiesen werden, die einen tendenziell M2 geprägten Charakter aufweisen. Dieser ist höchstwahrscheinlich an einer Stimulation der invasiven Eigenschaften der Tumorzellen beteiligt. Durch qRT-PCR und immunhistochemische Analysen konnten Hinweise gesammelt werden, dass nicht explizit die Quantität oder spezifische Lokalisation von Makrophagenphänotypen, sondern mutmaßlich eher das Zytokinprofil des Tumors und der Mikroumgebung und damit einhergehend der Polarisationsstatus der Makrophagen zum Metastasierungserfolg beiträgt. Eine Inkubation von CMT-93 Zellen mit konditionierten Medien der verschiedenen Makrophagenphänotypen bestätigte die Rolle sezernierter Faktoren. Eine indirekte Interaktion zwischen Tumorzelle und M2 Makrophagen reicht offensichtlich aus, um tumorstimulierende Eigenschaften, Aggressivität und Proliferationsfähigkeit der Zelllinie zu beeinflussen. Somit wurden Gene und Signalwege identifiziert, die relevant sind für eine erfolgreiche Induktion und Progression von Lebermetastasen infolge der Implantation von CRC-Zellen. Eine Adaptation des Genexpressionsprofils der CMT-93 Zelllinie im Zuge der Leberkolonisation konnte nachgewiesen werden. Das molekulare Profil bzw. die Gensignatur der Metastasen korrelierte dabei in hohem Maße mit der Migrations- und Invasionsfähigkeit der Tumorzellen. Insbesondere die Anwendung bioinformatischer Methoden erwies sich dabei als nützliches Werkzeug zur Analyse von großen Datensätzen, die mittels RNA Sequenzierung generiert wurden. Diese werden nun zur Formulierung prädiktiver Modelle der Metastasierungsvorgänge genutzt, um deregulierte Gene und damit einhergehend die Aggressivität von Tumorzellen gezielt identifizieren und konsekutiv beeinflussen zu können. Eine Analyse der Makrophagenphänotypen und ihrer Interaktion mit Tumorzellen verdeutlichte den durchaus tumorstimulierend geprägten Charakter der CMT-93 induzierten Lebermetastasen und den Einfluss des Zytokinprofils auf die Tumorprogression. Eine weiterführende Untersuchung der Makrophagenpolarisation bedarf jedoch eine rigorose Charakterisierung der Phänotypen anhand weiterer spezifischer Marker. Die subtile Analyse wird Rückschlüsse der organspezifischen Einflüsse des Zytokinprofils auf die kolorektale Karzinogenese erlauben.
4

Cell states and transcriptional programs of the healthy human heart

Litviňuková, Monika 19 April 2023 (has links)
Das Herz ist das zentrale Kreislauforgan in unserem Körper und jede Abweichung seiner Funktion wirkt sich negativ auf die Homöostase des gesamten Körpers aus. Die Herzfunktion beruht auf der Synergie der Zellen, die das Organ bilden. Die detaillierte zelluläre Zusammensetzung sowie die Funktionalität der einzelnen Zellen müssen noch ermittelt werden, und diese Arbeit ist eine wichtige Ergänzung dieser Bemühungen. Dank der jüngsten Entwicklungen in den Einzelzelltechnologien sind wir nun in der Lage, Transkriptome einzelner Zellen aus komplexem Gewebe in beispiellosem Umfang zu charakterisieren. Im ersten Schritt eines solchen Experiments müssen die Zellen und Zellkerne aus dem Gewebe befreit und vereinzelt werden. Herzgewebe wirft in dieser Hinsicht einzigartige Herausforderungen auf, darunter die Knappheit des gesunden menschlichen Herzgewebes für die Forschung, das Vorhandensein von Kardiomyozyten, die aufgrund ihrer Größe nicht durch Microfluid-basierte Standardinstrumente passen und deren Multinukleation, sowie mögliche Voreingenommenheit verschiedener Methoden zur Gewebedissoziation. Hier präsentiere ich den umfassenden Zellatlas des gesunden erwachsenen menschlichen Herzens. Ich beginne mit der Methodenentwicklung zur Isolierung von einzelnen Zellen und Zellkernen aus Mausherzen. Um den Zellatlas des menschlichen Herzens zu erstellen, analysiere ich einen Datensatz von fast einer halben Million Einzelzellen und Zellkerne aus sechs Herzregionen von vierzehn gesunden Menschen. In diesem Atlas definieren wir 11 Hauptzelltypen und 62 Zellzustände des menschlichen Herzens. Ein tieferer Fokus wird auf das Herzgefäßsystem gelegt und die Zellen der arterio-venösen Achse sowie deren Wechselwirkungen und potenzielle Funktionalität werden definiert. Insgesamt präsentiert diese Dissertation einen komplex Datensatz aus menschlichem Herzgewebe und liefert neue Einblicke in die Biologie des gesunden Herzens mit Implikationen für kardiovaskuläre Erkrankungen. / The heart is the central circulatory organ in our bodies and any discrepancies of its function relative to healthy homeostasis negatively impact the whole body. Cardiac function relies on the synergy of all the cells that constitute the organ. The detailed cellular composition as well as the heterogeneity and functionality of the individual cells is yet to be established and this work is a major advance in this effort. Thanks to the recent developments in single cell genomics technologies, we are now able to profile transcriptomes from individual cells of complex tissues at unprecedented scale. In the first step of such an experiment, the single cells and nuclei need to be liberated from the tissue. Heart tissue presents a unique set of challenges in this regard, including the scarcity of healthy human cardiac tissue for research, large cardiomyocytes that do not fit into the standard droplet-based instruments, multinucleation of cardiomyocytes that might skew the proportions of the recovered nuclei as well as potential bias of tissue dissociation methods. Here I present a cell atlas of the free walls, apex and septum of the healthy adult human heart. I start with methods development for the isolation of single cells and single nuclei from mouse heart. Next, I move to the building of the atlas of the human cells and nuclei, where I describe the dataset of close to half a million single cells and nuclei sampled from 14 organ donors, defining 11 major cell types and 62 cell states of the heart. A deeper focus on the cardiac vasculature defined the cells of the arterio-venous axis as well as their interactions and potential functionality. Overall, this thesis presents a joined dataset of single cells and single nuclei from human cardiac tissues and provides new insights into cardiac biology in heath with implications for cardiovascular disease.
5

Regulating with ribonucleases in Streptococcus pyogenes

Broglia, Laura 10 July 2020 (has links)
Bakterien haben eine Vielzahl an Strategien entwickelt, um sich an ständig wechselnde Umweltbedingungen anzupassen, darunter auch post-transkriptionelle regulatorische Mechanismen. Die Genexpression kann hierbei durch gezielten Abbau oder Stabilisierung von RNA durch Ribonukleasen (RNasen) reguliert werden. RNasen weisen je nach Spezies allerdings unterschiedliche Effekte auf Genexpression und bakterielle Physiologie, sowie verschiedene Strategien der Substraterkennung auf. Dies zeigt, dass unser Verständnis des RNA-Abbaus bei weitem nicht vollständig ist. Ziel dieser Arbeit ist es, die Eigenschaften und Funktionen der endoRNase Y des humanpathogenen Bakteriums Streptococcus pyogenes zu studieren. Um Einblick in Funktion und Spezifität dieser RNase zu gewinnen, wurden deren genomweite Schnittpositionen (“targetome”) mit Hilfe von RNA-Sequenzierung identifiziert. Zur weiteren Analyse des RNase Y-abhängigen RNA-Abbaus wurde dieses Ergebnis mit dem “targetome” der drei 3′-5′-Exoribonukleasen (ExoRNasen) PNPase, YhaM und RNase R verglichen. Schließlich wurden die Anforderungen für die Prozessierung durch RNase Y und deren Rolle in der Regulation von Virulenzgenen in vivo anhand der speB mRNA, die einen wichtigen Virulenzfaktor codiert, untersucht. Wir konnten in dieser Arbeit zeigen, dass RNase Y Substrate bevorzugt nach einem Guanosin schneidet und dieses Nukleosid essenziell für die Prozessierung der speB mRNA in vivo ist. Obwohl RNase Y die speB mRNA schneidet, unterstützen die Daten ein Modell nach dem RNase Y die Expression von speB auf transkriptioneller Ebene reguliert. Mit Hilfe des “targetome”-Vergleichs konnten wir ferner zeigen, dass RNase Y den RNA-Abbau in S. pyogenes initiiert und die dabei generierten 3′-Enden der RNA hauptsächlich von den 3′-5′-exoRNasen PNPase und/oder YhaM prozessiert werden. Zusammenfassend erweitern diese Erkenntnisse unser Verständnis der Funktionalität von RNase Y und des RNA-Abbaus in Gram-positiven Bakterien. / Bacteria have developed a plethora of strategies to cope with constantly changing environmental conditions, including post-transcriptional regulatory mechanisms. With this regard, regulation of gene expression can be achieved by either the rapid removal or stabilization of RNA molecules by ribonucleases (RNases). RNases exhibit species-specific effects on gene expression, bacterial physiology and different strategies of target recognition, indicating that our understanding of the RNA degradation machinery is not yet complete. The aim of this thesis was to investigate the features and functions of endoRNase Y from the strict human pathogen Streptococcus pyogenes. To gain insight into the role and specificity of this RNase, we identified RNase Y cleavage positions (i.e. targetome) genome-wide by RNA sequencing. Next, to investigate the RNA degradation pathway depending on RNase Y, we compared the RNase Y targetome with the ones of the three 3′-to-5′ exoribonuclease (exoRNases), namely PNPase, YhaM and RNase R. Finally, to dissect the requirements for RNase Y processing and to decipher the role of RNase Y in virulence gene regulation, we studied the impact of RNase Y on speB mRNA, encoding a major virulence factor. This study reveals that RNase Y preferentially cleaves RNAs downstream of a guanosine and for the first time we were able to show that the presence of a guanosine residue is essential for the processing of speB mRNA, in vivo. Although RNase Y cleaves the speB mRNA, our data underpin a model in which RNase Y-mediated regulation of speB expression occurs at the transcriptional level. Using the targetome comparative approach, we demonstrated that RNase Y initiates RNA decay in S. pyogenes and that the RNase Y-generated RNA 3′ ends are usually further trimmed by PNPase and/or YhaM. Overall, these findings increase our understanding of RNase Y functionality and RNA degradation in Gram-positive bacteria.
6

Cyclins and their roles in cell cycle progression, transcriptional regulation and osmostress adaptation in Saccharomyces cerevisiae. A transcriptome-wide and single cell approach

Teufel, Lotte 12 March 2020 (has links)
Der eukaryotische Zellzyklus ist ein streng regulierter Prozess, für dessen zeitlichen Ablauf unter anderem oszillierende Genexpression notwendig ist. Die Regulation und die zeitliche Koordination des Zellzyklus sind nach wie vor fundamentale Fragen der Zellbiologie. Spezifische Ereignisse, wie DNA Replikation und Zellkernteilung, können vier Zellzyklusphasen zugeordnet werden, welche durch Cyclin-abhängige Kinasen, Cycline und deren Inhibitoren reguliert werden. Während in Saccharomyces cerevisiae Cyclin-abhängige Kinasen (Cdc28, Pho85) über den gesamten Zellzyklus zu Verfügung stehen, werden Cycline und ihre Inhibitoren nur in spezifischen Phasen exprimiert. In S. cerevisiae sind drei wichtige G1-Cycline (Cln1-Cln3) in die oszillierende Genexpression involviert. In dieser Arbeit wurde die zeitaufgelöste, transkriptomweite Genexpression im Wildtyp und in Cyclindeletionsmutanten gemessen. Um die Rolle der G1-Cycline für die Feinabstimmung des Zellzykluses zu verstehen, wurden Gene nach charakteristischen Expressionsprofilen geclustert, Expressionsmaxima detektiert, ein Transkriptionsfaktornetzwerk integriert und Zellzyklusphasendauern bestimmt. Um Unterschiede zwischen der Rolle der Cycline zu verstehen, wurden die Zellen zusätzlich Osmostress ausgesetzt. Des Weiteren wurde mit Hilfe von RNA-Fluorescence In Situ Hybridization (FISH) die Expression zweier Cycline (PCL1 und PCL9), die an Pho85 binden, auf Einzelzellniveau gemessen. Um die Expression in spezifischen Zellzyklusphasen zu quantifizieren, wurden einzelne Zellen mithilfe von Zellzyklusmarkern spezifischen Zellzyklusphasen zugeordnet. Nachdem die Expression unter normalen Wachstumsbedingungen gemessen wurde, wurde zusätzlich Osmostress angewandt. Durch die Kombination einer Einzelzellquantifizierung und einer transkriptomweiten Methode konnten spezifische Aufgaben der Cycline, Cln1, Cln2 und Cln3, erforscht werden. Zusätzlich konnten backup Mechanismen für die Zellzyklusregulation entschlüsselt werden. / The eukaryotic cell cycle is a highly ordered process. For its timing and progression, oscillating gene expression is crucial. The stability of cell cycle regulation and the exact timing is still a fundamental question in cell biology. Specific events, like DNA replication and nuclear division can be assigned to four distinct phases. These events are regulated by cyclin-dependent kinases, cyclins and their inhibitors. In Saccharomyces cerevisiae cyclin-dependent kinases (Cdc28, Pho85) are present throughout the cell cycle, while cyclins and their inhibitors are only expressed and active during specific phases. The G1 cyclins Cln1-3 are essential players to induce oscillating gene expression and are thereby involved in the fine-tuning of the cell cycle. To understand the role of the G1 cyclins for exact cell cycle timing and oscillating gene expression, time-resolved, transcriptome-wide gene expression in wild type and cyclin deletion mutants were measured. Characteristic expression profiles were clustered, precise peak times for each gene were estimated, a transcription factor network was integrated and cell cycle phase durations were defined. To further understand the role and differences of each cyclin osmostress was applied. Furthermore the expression of two cyclins (PCL1 and PCL9) corresponding to the cyclin-dependent kinase Pho85 was measured in single cells. Using RNA-Fluorescence In Situ Hybridization (FISH) and cell cycle progression markers, high and low expression phases and absolute numbers of mRNAs were obtained. Gene expression was quantified under normal and osmostressed growth conditions to understand the necessity of the cyclins for osmostress adaptation in different cell cycle phases. By the combination of a single cell and a transcriptome-wide approach distinct roles of G1 cyclins Cln1, Cln2 and Cln3 were deciphered and an insight in the backup mechanisms during cell cycle progression for normal and osmostressed growth conditions were proposed.
7

Comparative analysis of gene expression associations between mammalian hosts and Plasmodium

Mukherjee, Parnika 04 August 2023 (has links)
Artenübergreifende Interaktionen helfen uns, Krankheitsmechanismen zu verstehen und Targets für Therapien zu finden. Die Koexpression von Genen, gemessen an der mRNA-Häufigkeit, kann Interaktionen zwischen Wirt und Pathogen aufzeigen. Die RNA-Sequenzierung von Wirt und Pathogen wird als "duale RNA-Sequenzierung" bezeichnet. Malaria ist eine der am besten untersuchten parasitären Krankheiten, so dass eine Fülle von RNA-seq-Datensätzen öffentlich zugänglich ist. Die Autoren führen entweder duale RNA-seq durch, um den Wirt und den Parasiten gleichzeitig zu untersuchen, oder sie erhalten kontaminierende Sequenzierungs-Reads aus dem Nicht-Zielorganismus. Ich habe eine Meta-Analyse durchgeführt, bei diese beiden Arten von RNA-seq-Studien verwendet wurden, um über korrelierte Genexpression auf Wirt-Parasit-Interaktionen zu schließen. Ich habe Studien mit Homo sapiens, Mus musculus und Macaca mulatta als Wirte und ihre Plasmodium-Parasiten einbezogen. Ich benutzte orthologe Einzelkopien von Genen, um ein Repertoire von Interaktionen bei Malaria und in diesen Modellsystemen zu erstellen. Ich verknüpfte die Daten von 63 Plasmodium-Phasen-spezifischen Studien und reduzierte die Zahl der Interaktionen von potenziell 56 Millionen auf eine kleinere, relevantere Menge. Die Zentralität in den Netzwerken der Blutphasen konnte die Essentialität der Plasmodium-Gene erklären. Das aus den verketteten Daten sagte die Genessenzialität besser vor als die einzelnen Studien - ein Vorteil der Meta-Analyse. Neutrophile und Monozyten Immunmarkergene waren überrepräsentiert, was auf eine Fülle von phagozytären und respiratorischen Reaktionen hindeutet. Die Analyse der Leberphase ergab Wirts- und Parasitenprozesse in frühen und späten Entwicklungsphasen. Ich fand bekannte Wirt-Parasit-Interaktionen, die für beide Phasen gleich sind, sowie bisher unbekannte Interaktionen. Dieses Prinzip lässt sich auch auf andere Krankheiten anwenden, um Mechanismen und therapeutische Ziele zu verstehen. / Cross-species interactions help us understand disease mechanisms and find targets for therapy. Gene co-expression, measured by mRNA abundance, can identify host-pathogen interactions. The RNA-sequencing of host and pathogen is termed “dual RNA-sequencing”. Malaria is one of the most studied eukayotic parasitic diseases, making an abundance of RNA-seq data sets publicly available. Authors either perform dual RNA-seq to study the host and parasite simultaneously or acquire contaminant sequencing reads from the non-target organism. I performed a meta-analysis using these two kinds of RNA-seq studies to infer host-parasite interactions using correlated gene expression. I included studies of Homo sapiens, Mus musculus and Macaca mulatta as hosts and their corresponding Plasmodium parasites. I used single-copy orthologous genes to generate a repertoire of interactions in human malaria and in these model systems. I found 63 malaria RNA-seq studies. I concatenated sequencing runs from Plasmodium stage-specific studies and reduced the number of interactions from a potential 56 million to a smaller, more relevant set. Centrality in the blood stage networks was able to explain Plasmodium gene essentiality. The network from the concatenated data predicted gene essentiality better than the individual studies, indicating a benefit of the meta-analysis. Immune marker genes for neutrophils and monocytes were over-represented, suggesting an abundance of phagocytic and respiratory burst-related responses. The liver stage analysis revealed linked host and parasite processes at early stages until late developmental stages. I found linked host and parasite processes that are common to the two stages, e.g. parasite cell gliding and invasion and host response to hypoxia and immune response. I showed that existing data can be explored for new information. This principle can be applied to other diseases to understand mechanisms and therapeutic targets.
8

Methods for Analyzing Complex and Multi-conditional Single-cell Data

Peidli, Stefan 11 January 2024 (has links)
Über die letzten Jahre haben sich Einzelzelldaten als Trend in der Bioinformatik etabliert, was zu umfangreichen Datensätzen führte. Die Entwicklung von Analysemethoden für solche Daten hat jedoch nicht mit deren Produktion Schritt gehalten. Diese Arbeit befasst sich mit einigen Problemen, die beim Analysieren von Einzelzelldaten auftreten. Das zweite Kapitel enthält eine Analyse von scRNA-seq-Daten von Darmkrebspatienten und Organoiden. Es werden Entwicklungstrajektorien des Darms beschrieben. Anschließend werden Signalgradienten dieser Achsen charakterisiert, insbesondere MAPK- und WNT-Signale. Weiter wird gezeigt, wie RNA velocity basierend auf metabolischen labeling ähnliche Trajektorien in Organoiden aufzeigen kann. Schließlich werden Auswirkungen von Signalwegenhemmung auf die Entwicklungstrajektorien im Detail beschrieben. Das dritte Kapitel bietet einen noch nie dagewesenen Einblick in frühe Stadien von COVID-19 in der Lunge. Verwendete scRNA-seq Daten stammen aus Lungengewebeproben etablierter Hamstermodelle, die mehrere Spezies, SARS-CoV-2-Dosen und Zeitpunkte umfassen, und die ich mit entsprechenden Daten von menschlichen Patienten vergleiche. Für die Analyse zentraler Zelltypen, die den unterschiedlichen Krankheitsverläufen zugrunde liegen, wende ich post-hoc Interpretation auf sonst unzugängliche latent spaces von diffusionmaps an, die neue Einblicke in die zelluläre Pathogenese von COVID-19 bieten. Im letzten Kapitel stelle ich scperturb vor, die größte Sammlung von perturbierten Einzelzelldaten. Ich zeige, wie E-Statistik verwendet werden kann, um solche Daten auf statistisch fundierte Weise zu analysieren. Verzerrungen werden mittels eines neuen Term zur Korrektur der E-Distanz beseitigt. Anschließlich untersuche ich Robustheit der E-Statistiken für einige Analyseszenarien, wie die COVID-19 Daten aus vorherigen Kapitel. Schließlich leite ich Richtlinien für die experimentelle Planung von Einzelzell-Perturbationsstudien mit robuster Statistik ab. / In recent years, single-cell data has emerged as leading trend in bioinformatics, resulting in the generation of substantial datasets. However, development of analysis methods for single-cell data has not kept pace with its production, presenting challenges for analysts. This thesis addresses some of the most pressing issues encountered during the analysis of single-cell data. After a short introductory chapter, the second chapter deals with the problem of arranging single-cell transcriptomes based on biological trajectories, and how these correlate with signaling pathways, specifically those relevant as targets for potential treatments. This thesis demonstrates how RNA velocity based on metabolic labeling can recover similar trajectories in organoids, identifying WNT and MAPK as underlying signaling pathways for development in normal and colon cancer organoids. The third chapter provides an unprecedented view into early stages of COVID-19 in the lungs. For the analysis of key cell types underlying divergent COVID-19 outcomes I apply post-hoc interpretation methods to otherwise inaccessible latent spaces of diffusion maps, revealing new insights into the cellular pathogenesis of COVID-19. Used scRNA-seq data is derived from lung tissue samples of established hamster models, encompassing multiple species, varying SARS-CoV-2 doses, and time points, which I then compare to data from human patients. In the fourth chapter, I present scperturb, the largest collection of single-cell perturbation data. I show how E-statistics can be used to analyze such data in a statistically sound way. After introducing a new bias-correction term to the calculation of E-distances, I investigate the robustness of resulting E-statistics for various analysis scenarios, such as the COVID-19 data from the previous chapter. Finally, I derive guidelines for the experimental design of single-cell perturbation studies such that robust statistics can be achieved.
9

Co-transcriptional splicing in two yeasts

Herzel, Lydia 18 September 2015 (has links) (PDF)
Cellular function and physiology are largely established through regulated gene expression. The first step in gene expression, transcription of the genomic DNA into RNA, is a process that is highly aligned at the levels of initiation, elongation and termination. In eukaryotes, protein-coding genes are exclusively transcribed by RNA polymerase II (Pol II). Upon transcription of the first 15-20 nucleotides (nt), the emerging nascent RNA 5’ end is modified with a 7-methylguanosyl cap. This is one of several RNA modifications and processing steps that take place during transcription, i.e. co-transcriptionally. For example, protein-coding sequences (exons) are often disrupted by non-coding sequences (introns) that are removed by RNA splicing. The two transesterification reactions required for RNA splicing are catalyzed through the action of a large macromolecular machine, the spliceosome. Several non-coding small nuclear RNAs (snRNAs) and proteins form functional spliceosomal subcomplexes, termed snRNPs. Sequentially with intron synthesis different snRNPs recognize sequence elements within introns, first the 5’ splice site (5‘ SS) at the intron start, then the branchpoint and at the end the 3’ splice site (3‘ SS). Multiple conformational changes and concerted assembly steps lead to formation of the active spliceosome, cleavage of the exon-intron junction, intron lariat formation and finally exon-exon ligation with cleavage of the 3’ intron-exon junction. Estimates on pre-mRNA splicing duration range from 15 sec to several minutes or, in terms of distance relative to the 3‘ SS, the earliest detected splicing events were 500 nt downstream of the 3‘ SS. However, the use of indirect assays, model genes and transcription induction/blocking leave the question of when pre-mRNA splicing of endogenous transcripts occurs unanswered. In recent years, global studies concluded that the majority of introns are removed during the course of transcription. In principal, co-transcriptional splicing reduces the need for post-transcriptional processing of the pre-mRNA. This could allow for quicker transcriptional responses to stimuli and optimal coordination between the different steps. In order to gain insight into how pre-mRNA splicing might be functionally linked to transcription, I wanted to determine when co-transcriptional splicing occurs, how transcripts with multiple introns are spliced and if and how the transcription termination process is influenced by pre-mRNA splicing. I chose two yeast species, S. cerevisiae and S. pombe, to study co-transcriptional splicing. Small genomes, short genes and introns, but very different number of intron-containing genes and multi-intron genes in S. pombe, made the combination of both model organisms a promising system to study by next-generation sequencing and to learn about co-transcriptional splicing in a broad context with applicability to other species. I used nascent RNA-Seq to characterize co-transcriptional splicing in S. pombe and developed two strategies to obtain single-molecule information on co-transcriptional splicing of endogenous genes: (1) with paired-end short read sequencing, I obtained the 3’ nascent transcript ends, which reflect the position of Pol II molecules during transcription, and the splicing status of the nascent RNAs. This is detected by sequencing the exon-intron or exon-exon junctions of the transcripts. Thus, this strategy links Pol II position with intron splicing of nascent RNA. The increase in the fraction of spliced transcripts with further distance from the intron end provides valuable information on when co-transcriptional splicing occurs. (2) with Pacific Biosciences sequencing (PacBio) of full-length nascent RNA, it is possible to determine the splicing pattern of transcripts with multiple introns, e.g. sequentially with transcription or also non-sequentially. Part of transcription termination is cleavage of the nascent transcript at the polyA site. The splicing status of cleaved and non-cleaved transcripts can provide insights into links between splicing and transcription termination and can be obtained from PacBio data. I found that co-transcriptional splicing in S. pombe is similarly prevalent to other species and that most introns are removed co-transcriptionally. Co-transcriptional splicing levels are dependent on intron position, adjacent exon length, and GC-content, but not splice site sequence. A high level of co-transcriptional splicing is correlated with high gene expression. In addition, I identified low abundance circular RNAs in intron-containing, as well as intronless genes, which could be side-products of RNA transcription and splicing. The analysis of co-transcriptional splicing patterns of 88 endogenous S. cerevisiae genes showed that the majority of intron splicing occurs within 100 nt downstream of the 3‘ SS. Saturation levels vary, and confirm results of a previous study. The onset of splicing is very close to the transcribing polymerase (within 27 nt) and implies that spliceosome assembly and conformational rearrangements must be completed immediately upon synthesis of the 3‘ SS. For S. pombe genes with multiple introns, most detected transcripts were completely spliced or completely unspliced. A smaller fraction showed partial splicing with the first intron being most often not spliced. Close to the polyA site, most transcripts were spliced, however uncleaved transcripts were often completely unspliced. This suggests a beneficial influence of pre-mRNA splicing for efficient transcript termination. Overall, sequencing of nascent RNA with the two strategies developed in this work offers significant potential for the analysis of co-transcriptional splicing, transcription termination and also RNA polymerase pausing by profiling nascent 3’ ends. I could define the position of pre-mRNA splicing during the process of transcription and provide evidence for fast and efficient co-transcriptional splicing in S. cerevisiae and S. pombe, which is associated with highly expressed genes in both organisms. Differences in S. pombe co-transcriptional splicing could be linked to gene architecture features, like intron position, GC-content and exon length.
10

Co-transcriptional splicing in two yeasts

Herzel, Lydia 10 September 2015 (has links)
Cellular function and physiology are largely established through regulated gene expression. The first step in gene expression, transcription of the genomic DNA into RNA, is a process that is highly aligned at the levels of initiation, elongation and termination. In eukaryotes, protein-coding genes are exclusively transcribed by RNA polymerase II (Pol II). Upon transcription of the first 15-20 nucleotides (nt), the emerging nascent RNA 5’ end is modified with a 7-methylguanosyl cap. This is one of several RNA modifications and processing steps that take place during transcription, i.e. co-transcriptionally. For example, protein-coding sequences (exons) are often disrupted by non-coding sequences (introns) that are removed by RNA splicing. The two transesterification reactions required for RNA splicing are catalyzed through the action of a large macromolecular machine, the spliceosome. Several non-coding small nuclear RNAs (snRNAs) and proteins form functional spliceosomal subcomplexes, termed snRNPs. Sequentially with intron synthesis different snRNPs recognize sequence elements within introns, first the 5’ splice site (5‘ SS) at the intron start, then the branchpoint and at the end the 3’ splice site (3‘ SS). Multiple conformational changes and concerted assembly steps lead to formation of the active spliceosome, cleavage of the exon-intron junction, intron lariat formation and finally exon-exon ligation with cleavage of the 3’ intron-exon junction. Estimates on pre-mRNA splicing duration range from 15 sec to several minutes or, in terms of distance relative to the 3‘ SS, the earliest detected splicing events were 500 nt downstream of the 3‘ SS. However, the use of indirect assays, model genes and transcription induction/blocking leave the question of when pre-mRNA splicing of endogenous transcripts occurs unanswered. In recent years, global studies concluded that the majority of introns are removed during the course of transcription. In principal, co-transcriptional splicing reduces the need for post-transcriptional processing of the pre-mRNA. This could allow for quicker transcriptional responses to stimuli and optimal coordination between the different steps. In order to gain insight into how pre-mRNA splicing might be functionally linked to transcription, I wanted to determine when co-transcriptional splicing occurs, how transcripts with multiple introns are spliced and if and how the transcription termination process is influenced by pre-mRNA splicing. I chose two yeast species, S. cerevisiae and S. pombe, to study co-transcriptional splicing. Small genomes, short genes and introns, but very different number of intron-containing genes and multi-intron genes in S. pombe, made the combination of both model organisms a promising system to study by next-generation sequencing and to learn about co-transcriptional splicing in a broad context with applicability to other species. I used nascent RNA-Seq to characterize co-transcriptional splicing in S. pombe and developed two strategies to obtain single-molecule information on co-transcriptional splicing of endogenous genes: (1) with paired-end short read sequencing, I obtained the 3’ nascent transcript ends, which reflect the position of Pol II molecules during transcription, and the splicing status of the nascent RNAs. This is detected by sequencing the exon-intron or exon-exon junctions of the transcripts. Thus, this strategy links Pol II position with intron splicing of nascent RNA. The increase in the fraction of spliced transcripts with further distance from the intron end provides valuable information on when co-transcriptional splicing occurs. (2) with Pacific Biosciences sequencing (PacBio) of full-length nascent RNA, it is possible to determine the splicing pattern of transcripts with multiple introns, e.g. sequentially with transcription or also non-sequentially. Part of transcription termination is cleavage of the nascent transcript at the polyA site. The splicing status of cleaved and non-cleaved transcripts can provide insights into links between splicing and transcription termination and can be obtained from PacBio data. I found that co-transcriptional splicing in S. pombe is similarly prevalent to other species and that most introns are removed co-transcriptionally. Co-transcriptional splicing levels are dependent on intron position, adjacent exon length, and GC-content, but not splice site sequence. A high level of co-transcriptional splicing is correlated with high gene expression. In addition, I identified low abundance circular RNAs in intron-containing, as well as intronless genes, which could be side-products of RNA transcription and splicing. The analysis of co-transcriptional splicing patterns of 88 endogenous S. cerevisiae genes showed that the majority of intron splicing occurs within 100 nt downstream of the 3‘ SS. Saturation levels vary, and confirm results of a previous study. The onset of splicing is very close to the transcribing polymerase (within 27 nt) and implies that spliceosome assembly and conformational rearrangements must be completed immediately upon synthesis of the 3‘ SS. For S. pombe genes with multiple introns, most detected transcripts were completely spliced or completely unspliced. A smaller fraction showed partial splicing with the first intron being most often not spliced. Close to the polyA site, most transcripts were spliced, however uncleaved transcripts were often completely unspliced. This suggests a beneficial influence of pre-mRNA splicing for efficient transcript termination. Overall, sequencing of nascent RNA with the two strategies developed in this work offers significant potential for the analysis of co-transcriptional splicing, transcription termination and also RNA polymerase pausing by profiling nascent 3’ ends. I could define the position of pre-mRNA splicing during the process of transcription and provide evidence for fast and efficient co-transcriptional splicing in S. cerevisiae and S. pombe, which is associated with highly expressed genes in both organisms. Differences in S. pombe co-transcriptional splicing could be linked to gene architecture features, like intron position, GC-content and exon length.

Page generated in 0.0685 seconds