Spelling suggestions: "subject:"sequenzdaten"" "subject:"sequenzdauer""
1 |
Strukturbasierte Beschreibung und Suche von RNA-Familien in genomischen SequenzdatenGräf, Stefan Andreas. Unknown Date (has links)
Universiẗat, Diss., 2005--Düsseldorf.
|
2 |
Gezielte Anreicherungs- und neue DNA-Sequenzierungsstrategien für die molekulare Analyse von Fanconi-Anämie-Genen / Targeted enrichment and novel DNA sequencing strategies for the molecular analysis of fanconi anemia genesRost, Isabell January 2020 (has links) (PDF)
Fanconi-Anämie (FA) ist, mit Ausnahme von Mutationen in FANCR/RAD51, eine autosomal-rezessive oder X-chromosomal vererbte Krankheit, die sich durch eine ausgesprochene klinische als auch genetische Heterogenität auszeichnet. Neben einem fortschreitenden Knochenmarksversagen zählen zu den typischen Merkmalen eine Vielzahl an angeborenen Fehlbildungen, wie beispielsweise Radialstrahlanomalien, Minderwuchs oder Pigmentierungsstörungen. Zudem besteht für FA-Patienten ein überdurchschnittlich hohes Risiko bereits in jungen Jahren an akuter myeloischer Leukämie oder soliden Tumoren zu erkranken. Bislang konnten in 21 FA-Genen (FANCA, -B, -C, - D1, -D2, -E, -F, -G, -I, -J, -L, -M, -N, -O, -P, -Q, -R, -S, -T, -U oder -V) krankheitsverursachende Mutationen identifiziert werden, deren Proteinprodukte maßgeblich an der Aufrechterhaltung der Genomstabilität beteiligt sind und Komponenten des FA/BRCA-DNA-Reparaturweges darstellen. In der klassischen FA-Mutationsanalyse kommen meist Sanger-Sequenzierungen sowie MLPA- und Immunblot-Analysen zum Einsatz. Da im Wesentlichen keine Genotyp-Phänotyp-Korrelation besteht, gestaltet sich, gerade bei seltenen FA-Komplementationsgruppen, der Nachweis von krankheitsverursachenden Mutationen oftmals sehr zeit- und kostenintensiv. Während der letzten Jahre wurden verschiedene Strategien zur Anreicherung und Sequenzierung entwickelt, welche die parallele Sequenzanalyse einzelner ausgewählter Gene, ganzer Exome oder sogar des gesamten Genoms und somit eine kosten- und zeiteffiziente Mutationsanalyse ermöglichen. In der vorliegenden Arbeit wurden unterschiedliche Anreicherungsmethoden mit anschließender Hochdurchsatzsequenzierung auf ihre Anwendbarkeit in der molekulargenetischen FA-Diagnostik getestet, um klassische Mutationsanalyse-Methoden zu ergänzen oder möglicherweise sogar ganz ersetzen zu können.
Der erste Teil der Arbeit befasste sich mit der Etablierung eines FA-spezifischen Genpanels zur Genotypisierung von FA-Patienten. Nachdem die Methode zunächst anhand von FA-Patienten mit bekannten Mutationen optimiert werden musste, erwies sie sich als effizienter Ansatz zum Nachweis krankheitsverursachender Mutationen bei FA-Patienten unbekannter Komplementationsgruppe. Durch die FA-Panelanalyse konnten 37 von 47 unklassifizierten Patienten einer FA-Komplementationsgruppe zugeordnet werden, indem deren kausalen Mutationen bestimmt wurden. In einem weiteren Ansatz sollte die Anwendbarkeit eines kommerziellen Anreicherungspanels zur FA-Diagnostik untersucht werden. Auch hier konnte ein Großteil der krankheitsverursachenden Mutationen von fünf bekannten wie auch 13 nicht zugeordneten FA-Patienten detektiert und somit eine molekulargenetische Diagnose bei neun weiteren, zuvor unklassifizierten FA-Patienten, gestellt werden. Ferner wurden sechs ausgewählte Patienten, zusätzlich zur Panelanreicherung, per Exomanalyse untersucht. Zum einen konnten Mutationen in bekannten FA-Genen bestätigt oder neu identifiziert werden. Zum anderen wurden auch potentiell pathogene Mutationen in DNA-Reparaturgenen außerhalb des FA/BRCA-Signalweges bei zwei Patienten mit unbestätigter Verdachtsdiagnose FA verifiziert. So wurde bei mehreren Mitgliedern einer Familie mit unterschiedlichen Tumorerkrankungen eine zuvor unbeschriebene homozygote Nonsense-Mutation in der BER-Glykosylase NTHL1 nachgewiesen, für welche bislang erst zwei pathogene Mutationen als Auslöser eines neuen Krebssyndroms bekannt sind. Bei einem weiteren Patienten wurden compound-heterozygote Mutationen in RPA1 detektiert, ein Gen für das bislang noch kein Krankheitsbild bekannt ist. Mit Hilfe der drei verschiedenen Anreicherungsstrategien konnten insgesamt 47 von 60 unklassifizierten FA-Patienten 13 verschiedenen Komplementationsgruppen eindeutig zugeordnet werden. Es zeigte sich dabei ein breites Spektrum an neuen, bislang unbeschriebenen FA-Mutationen. Den größten Anteil an der Gesamtzahl der nachgewiesenen Mutationen hatten Spleißmutationen, die auf eine Auswirkung auf das kanonische Spleißmuster untersucht wurden, um einen pathogenen Effekt nachweisen zu können.
Weiterhin schloss die Arbeit die Charakterisierung einzelner FA-Patienten bzw. Komplementationsgruppen mit ein. Dazu zählen die seltenen Untergruppen FA-T und FA-Q, für die jeweils ein neuer Patient identifiziert werden konnte. Durch die funktionelle Charakterisierung der dritten jemals beschriebenen FA-Q-Patientin konnten Einblicke in das Zusammenspiel der Reparatur von DNA-Quervernetzungen und der Nukleotidexzisionsreparatur gewonnen und die phänotypische Variabilität von FA durch die subjektive als auch zelluläre UV-Sensitivität der Patientin ergänzt werden. Darüber hinaus konnte das Mutationsspektrum in FA-I sowie FA-D2 erweitert werden. Eine genauere Untersuchung der Pseudogenregionen von FANCD2 ermöglichte dabei die gezielte Mutationsanalyse des Gens.
Insgesamt konnten die Ergebnisse dieser Arbeit dazu beitragen, das Mutationsspektrum in FA zu erweitern und durch die Identifizierung und Charakterisierung einzelner Patienten neue Einblicke in verschiedene Komponenten des FA/BRCA-Signalweges zu erhalten. Es zeigte sich, dass neue DNA-Sequenzierungsstrategien in der FA-Diagnostik eingesetzt werden können, um eine effiziente Mutationsanalyse zu gewährleisten und klassische Methoden in Teilbereichen zu ersetzen. / Fanconi anemia (FA) is, with the exception of mutations in FANCR/RAD51, an autosomal recessive or X-linked inherited disease that is characterized by a remarkable clinical and genetic heterogeneity. In addition to progressive bone marrow failure, typical features include a multitude of developmental malformations, such as radial ray anomalies, growth retardation or cutaneous pigment displacement. Additionally, FA patients have a higher risk for developing acute myelogenous leukemia or solid tumors early in life. To date, pathogenic mutations have been identified in 21 FA genes (FANCA, -B, -C, - D1, -D2, -E, -F, -G, -I, -J, -L, -M, -N, -O, -P, -Q, -R, -S, -T, -U or -V) whose protein products are responsible for maintaining genomic integrity and constitute components of the FA/BRCA DNA repair pathway. Typical methods for FA mutation analysis comprise Sanger sequencing as well as MLPA and immunoblot analyses. As no definite genotype-phenotype correlation exists, pathogenic mutation detection in rare subgroups is often quite time-consuming and cost-intensive. Within the last few years, distinct strategies for both enrichment and sequencing of a subset of genes, whole exomes or even the whole genome have been developed that facilitate a cost-effective and time-saving mutation analysis. In the present work different target-enrichment strategies followed by high-throughput sequencing were tested for their applicability in molecular genetic diagnostics of FA in order to complement or even replace classic strategies for mutation analysis.
The first part of this work addressed the establishment of an FA-specific gene panel for genotyping FA patients. After optimizing this method by means of FA patients with known mutations, this proved to be an efficient approach for detecting pathogenic mutations in FA patients of unknown complementation groups. Due to FA gene panel analysis, 37 of 47 unclassified FA patients were assigned to a complementation group based on the identification of their causative mutations. In another approach, a commercial enrichment panel was tested for its application in FA diagnostics. Again, most pathogenic mutations of five classified and 13 unclassified FA patients were detected, enabling a molecular diagnosis for nine previously unclassified FA patients. Moreover, six selected patients were studied by exome analysis in addition to panel enrichment. This allowed for mutations in known FA complementation groups to be confirmed or newly identified. Additionally, potentially pathogenic variants in DNA-repair genes outside the FA/BRCA pathway were verified in two patients with an unconfirmed suspected diagnosis of FA. One previously undescribed homozygous nonsense mutation in the BER glycosylase NTHL1 was detected in several members of one family with various tumors. For this gene, only two distinct pathogenic mutations were previously described to cause a novel cancer syndrome. In another patient, compound heterozygous mutations in RPA1 were detected, a gene for which no disease pattern is yet known. By means of the three different enrichment strategies a total of 47 of 60 unclassified FA patients were definitely assigned to 13 diverse complementation groups. In this context, a broad spectrum of previously undescribed mutations was identified. The majority of all verified mutations were splice mutations that were examined for an effect on the canonical splicing pattern in order to verify a pathogenic effect.
Additionally, this work also included the characterization of individual FA patients and complementation groups, respectively. These include the rare subgroups FA-T and FA-Q, for each of which one new patient was identified. Functional characterization of the third ever described FA-Q patient allowed new insights into the interplay of DNA interstrand-crosslink and nucleotide excision repair and broadened the spectrum of phenotypic variability of FA by the subjective and cellular UV sensitivity of this patient. Furthermore, the mutation spectrum in both FA-I and FA-D2 was expanded. Here, a closer investigation of the pseudogene regions of FANCD2 facilitated a precise mutation screening of the gene.
Overall, the results of this work broadened the mutation spectrum of FA and allowed new insights into diverse components of the FA/BRCA pathway by identifying and characterizing individual patients. It became apparent that novel strategies for DNA sequencing can be applied in FA diagnostics to ensure an efficient mutation analysis, as well as to replace some parts of classical approaches.
|
3 |
Integrative approaches to protein homology searchAlam, Intikhab. January 2005 (has links) (PDF)
Bielefeld, Univ., Diss., 2005.
|
4 |
Machine-Learning-Based Identification of Tumor Entities, Tumor Subgroups, and Therapy Options / Bestimmung von Tumorentitäten, Tumorsubgruppen und Therapieoptionen basierend auf maschinellem LernenMarquardt, André January 2023 (has links) (PDF)
Molecular genetic analyses, such as mutation analyses, are becoming increasingly important in the tumor field, especially in the context of therapy stratification. The identification of the underlying tumor entity is crucial, but can sometimes be difficult, for example in the case of metastases or the so-called Cancer of Unknown Primary (CUP) syndrome. In recent years, methylome and transcriptome utilizing machine learning (ML) approaches have been developed to enable fast and reliable tumor and tumor subtype identification. However, so far only methylome analysis have become widely used in routine diagnostics.
The present work addresses the utility of publicly available RNA-sequencing data to determine the underlying tumor entity, possible subgroups, and potential therapy options. Identification of these by ML - in particular random forest (RF) models - was the first task. The results with test accuracies of up to 99% provided new, previously unknown insights into the trained models and the corresponding entity prediction. Reducing the input data to the top 100 mRNA transcripts resulted in a minimal loss of prediction quality and could potentially enable application in clinical or real-world settings.
By introducing the ratios of these top 100 genes to each other as a new database for RF models, a novel method was developed enabling the use of trained RF models on data from other sources.
Further analysis of the transcriptomic differences of metastatic samples by visual clustering showed that there were no differences specific for the site of metastasis. Similarly, no distinct clusters were detectable when investigating primary tumors and metastases of cutaneous skin melanoma (SKCM).
Subsequently, more than half of the validation datasets had a prediction accuracy of at least 80%, with many datasets even achieving a prediction accuracy of – or close to – 100%.
To investigate the applicability of the used methods for subgroup identification, the TCGA-KIPAN dataset, consisting of the three major kidney cancer subgroups, was used. The results revealed a new, previously unknown subgroup consisting of all histopathological groups with clinically relevant characteristics, such as significantly different survival. Based on significant differences in gene expression, potential therapeutic options of the identified subgroup could be proposed.
Concludingly, in exploring the potential applicability of RNA-sequencing data as a basis for therapy prediction, it was shown that this type of data is suitable to predict entities as well as subgroups with high accuracy. Clinical relevance was also demonstrated for a novel subgroup in renal cell carcinoma. The reduction of the number of genes required for entity prediction to 100 genes, enables panel sequencing and thus demonstrates potential applicability in a real-life setting. / Molekulargenetische Analysen, wie z. B. Mutationsanalysen, gewinnen im Tumorbereich zunehmend an Bedeutung, insbesondere im Zusammenhang mit der Therapiestratifizierung. Die Identifizierung der zugrundeliegenden Tumorentität ist von entscheidender Bedeutung, kann sich aber manchmal als schwierig erweisen, beispielsweise im Falle von Metastasen oder dem sogenannten Cancer of Unknown Primary (CUP)-Syndrom. In den letzten Jahren wurden Methylom- und Transkriptom-Ansätze mit Hilfe des maschinellen Lernens (ML) entwickelt, die eine schnelle und zuverlässige Identifizierung von Tumoren und Tumorsubtypen ermöglichen. Bislang werden jedoch nur Methylomanalysen in der Routinediagnostik eingesetzt.
Die vorliegende Arbeit befasst sich mit dem Nutzen öffentlich zugänglicher RNA-Sequenzierungsdaten zur Bestimmung der zugrunde liegenden Tumorentität, möglicher Untergruppen und potenzieller Therapieoptionen. Die Identifizierung dieser durch ML - insbesondere Random-Forest (RF)-Modelle - war die erste Aufgabe. Die Ergebnisse mit Testgenauigkeiten von bis zu 99 % lieferten neue, bisher unbekannte Erkenntnisse über die trainierten Modelle und die entsprechende Entitätsvorhersage. Die Reduktion der Eingabedaten auf die 100 wichtigsten mRNA-Transkripte führte zu einem minimalen Verlust an Vorhersagequalität und könnte eine Anwendung in klinischen oder realen Umgebungen ermöglichen.
Durch die Einführung des Verhältnisses dieser Top 100 Gene zueinander als neue Datenbasis für RF-Modelle wurde eine neuartige Methode entwickelt, die die Verwendung trainierter RF-Modelle auf Daten aus anderen Quellen ermöglicht.
Eine weitere Analyse der transkriptomischen Unterschiede von metastatischen Proben durch visuelles Clustering zeigte, dass es keine für den Ort der Metastasierung spezifischen Unterschiede gab. Auch bei der Untersuchung von Primärtumoren und Metastasen des kutanen Hautmelanoms (SKCM) konnten keine unterschiedlichen Cluster festgestellt werden.
Mehr als die Hälfte der Validierungsdatensätze wiesen eine Vorhersagegenauigkeit von mindestens 80% auf, wobei viele Datensätze sogar eine Vorhersagegenauigkeit von 100% oder nahezu 100% erreichten.
Um die Anwendbarkeit der verwendeten Methoden zur Identifizierung von Untergruppen zu untersuchen, wurde der TCGA-KIPAN-Datensatz verwendet, welcher die drei wichtigsten Nierenkrebs-Untergruppen umfasst. Die Ergebnisse enthüllten eine neue, bisher unbekannte Untergruppe, die aus allen histopathologischen Gruppen mit klinisch relevanten Merkmalen, wie z. B. einer signifikant unterschiedlichen Überlebenszeit, besteht. Auf der Grundlage signifikanter Unterschiede in der Genexpression konnten potenzielle therapeutische Optionen für die identifizierte Untergruppe vorgeschlagen werden.
Zusammenfassend lässt sich sagen, dass bei der Untersuchung der potenziellen Anwendbarkeit von RNA-Sequenzierungsdaten als Grundlage für die Therapievorhersage gezeigt werden konnte, dass diese Art von Daten geeignet ist, sowohl Entitäten als auch Untergruppen mit hoher Genauigkeit vorherzusagen. Die klinische Relevanz wurde auch für eine neue Untergruppe beim Nierenzellkarzinom demonstriert. Die Verringerung der für die Entitätsvorhersage erforderlichen Anzahl von Genen auf 100 Gene ermöglicht die Sequenzierung von Panels und zeigt somit die potenzielle Anwendbarkeit in der Praxis.
|
5 |
Genomic Prediction for Quantitative Traits: Using Kernel Methods and Whole Genome Sequence Based Approaches / Genomische Vorhersage für quantitative Merkmale: Verwendung von Kernel-Methoden und Verfahren, die auf vollständigen Genomsequenzen basierenOber, Ulrike 28 September 2012 (has links)
No description available.
|
Page generated in 0.0602 seconds