Return to search

Inferring haplotype-specific chromatin conformation using Genome Architecture Mapping

Die räumliche Organisation des Chromatins im Zellkern ist für die Regulierung der Genexpression von großer Bedeutung. Genomische Varianten können die räumliche Organisation jedoch stören und Fehlbildungen und Krankheiten verursachen. In diploiden Genomen sind die meisten genomischen Varianten heterozygot und beeinflussen hauptsächlich das homologe Chromosom, auf dem sie sich befinden. Daher ist eine allelspezifische Analyse wichtig, erweist sich aber mit aktuellen Methoden zur Erfassung der Chromatinkonformation als äußerst schwierig. Erstens ist der Haplotyp, der die Verteilung unterschiedlicher Allele über die homologen Chromosomen beschreibt, oft unbekannt. Zweitens ist, insbesondere in Genomen mit geringer Variantendichte, wie dem menschlichen Genom, eine eindeutige Zuordnung der sequenzierten Genomabschnitte (Reads) zu ihrem Ursprungschromosom häufig nicht möglich, was die Erstellung haplotypspezifischer Chromatinkontaktmatrizen von guter Qualität verhindert.
Genome Architecture Mapping (GAM) ist eine vielversprechende neue Methode mit dem Potential zur haplotypspezifischen Analyse der Chromatinkonformation. In dieser Dissertation zeige ich zunächst, dass GAM-Daten wertvolle Haplotypinformationen enthalten. Dann stelle ich GAMIBHEAR vor, einen graphenbasierten Ansatz, der die von GAM-Daten abgeleiteten Phaseninformationen nutzt, um genaue und vollständige Haplotypen zu rekonstruieren. Schließlich stelle ich Co-Phasing vor, eine neue Read-Phasing-Strategie, die erstmalig die eindeutige Zuordnung von variantenfreien Reads zu ihrem homologen Ursprungschromosom ermöglicht und somit auch die Erstellung detaillierter haplotypspezifischer Chromatinkontaktmatrizen in Maus und Mensch.
Im Gegensatz zu früheren Erkenntnissen belegen meine Ergebnisse große Unterschiede in der räumlichen Organisation homologer Chromosomenkopien und ermöglichen erstmals einen sehr detaillierten Einblick in die haplotypspezifische Chromatinkonformation des menschlichen Genoms. / The spatial organization of chromatin in the nucleus plays an essential role in precise gene expression. Genomic variants can disrupt this spatial organization, potentially causing malformations and diseases. In diploid genomes, most genomic variants are heterozygous and mainly influence the homologous chromosome they reside on. Studying the effects of these variants in an allele-specific manner is crucial but has proven challenging using current state-of-the-art techniques. First, the haplotype describing the distribution of variant alleles over the homologous chromosomes is often unknown. Second, especially in genomes with a low variant density, such as the human genome, most sequencing reads map to genomic regions that are identical between homologous chromosomes, making it difficult to determine their origin. Thus, the read-phasing efficiency is insufficient to generate haplotype-specific chromatin contact matrices of good quality.
Genome Architecture Mapping (GAM) is a promising new method for haplotype-specific analysis of chromatin conformation. In this thesis, I first demonstrate the ability of GAM data to provide valuable haplotype information. Then, I introduce GAMIBHEAR, a graph-based approach that leverages the GAM-derived phase information to infer accurate and complete haplotypes. Finally, building on GAMIBHEAR, I present Co-Phasing, a novel read-phasing strategy that allows for the unique assignment of variant-free reads to their homologous chromosome of origin and thus enables the creation of detailed haplotype-specific chromatin contact matrices in mouse and human.
In contrast to previous findings, my results show significant differences in the spatial organization of homologous chromosomes and provide the first detailed view of haplotype-specific chromatin conformation in the human genome.

Identiferoai:union.ndltd.org:HUMBOLT/oai:edoc.hu-berlin.de:18452/26778
Date23 February 2023
CreatorsMarkowski, Julia
ContributorsPombo, Ana, Junker, Jan Philipp, Rahmann, Sven
PublisherHumboldt-Universität zu Berlin
Source SetsHumboldt University of Berlin
LanguageEnglish
Detected LanguageEnglish
TypedoctoralThesis, doc-type:doctoralThesis
Formatapplication/pdf
Rights(CC BY 4.0) Attribution 4.0 International, https://creativecommons.org/licenses/by/4.0/
Relation10.1093/bioinformatics/btab238

Page generated in 0.0024 seconds