Return to search

Direct assessment and validation of allele specific transcription factor binding in the human genome

Characterization of human genetic variation has focused on expression quantitative trait loci (eQTL) mapping; however, direct assessment of cis-regulatory variation requires allele-specific approaches. Measuring allelic expression (AE) on a genome-wide scale appears more powerful as environmental and trans-acting influences are minimized. Results indicate that allele-specific differences in transcript expression within an individual can affect up to 30% of loci. The underlying variants can be identified by mapping differences in AE on Illumina BeadChips. Over 50% of population variance in AE is explained by mapped cis-rSNPs. Studies show that these cis-rSNPs have been implicated in differences in transcription factor (TF) binding, suggesting that TF action can be further investigated using population variation as a tool. In this thesis, these approaches have been extended to explore allele-specific TF binding using the model NF-κB by monitoring the consequences of gene knockdown in a genome-wide manner. NF-κB has been shown to be involved in the immune response and the NF-κB motif is enriched in lymphoblastoid cell lines (LCLs), mainly in promoters and strong enhancer elements. We intersected mapped candidate cis-rSNPs detected in LCLs in our above experiments as well as matched control SNPs from HapMap YRI and CEU populations with publicly available NF-κB Chromatin Immunoprecipitation (ChIP)-seq experiments from the ENCODE project. Preliminary analysis of regions surrounding candidate cis-rSNPs were enriched in NF-κB binding sites versus matched controls, with 39.0 % of top SNPs overlapping at least one NF-κB ChIP-seq peak. To elucidate the impact of candidate SNPs on AE imbalances, we performed TNF- α induction coupled to inhibition of NF-κB in LCLs followed by AE analysis on Illumina HumanOmni5-Quad BeadChips. We used in house mapped cis-regulatory variants in the LCL population merged with data from the aforementioned experiment. Our data set, which consisted of loci associated to top 10 cis-rSNPs ranked by p-value (pv; top10= 10 most significant p-values) that showed diminished AE upon perturbation of NF-κB were overlapped with publicly available data. This data consisted of ENCODE ChIP-seq peaks and TRANSFAC binding sites for NF-κB and known cooperative TFs of NF-κB. Loci that had an AE change at greater than 3 SNPs upon perturbation of NF-κB and were associated to top heterozygous SNPs (rank 1, 2, 3) yielded 581 cases out of ~1700. Analysis of top 3 ¬cis-rSNPs described showed a significant difference of over 5-fold between case and control SNPs, such that 64% of loci had a top 3 heterozygous SNP that was found in an LCL specific TF ChIP-seq peak or TRANSFAC binding site for NF-κB or a known cooperative TF of NF-κB. Bioinformatics analysis suggests that identified SNPs are essential for NF-κB binding. A case study was also done in order to perturb the TF SNAI1 because we had a strong hypothesis for the association of SNAI1 and WNT4, as well as, evidence for its role in fibroblasts (FBs). We were not able to reproduce the effect of SNAI1 on WNT4 in vivo. Upon comparison of the regulatory role of NF-κB and SNAI1 in LCLs and FBs, respectively; we observed that NF-κB had a regulatory effect on approximately 33% of loci in comparison to only approximately 2% of loci for SNAI1 in FBs. This study illustrates that key regulatory TFs, such as NF-κB in LCLs, can be globally studied at a single base resolution in living cells using a combination of perturbation and sensitive measurements with allelic resolution. / La caractérisation de la variation génétique a mis l'accent sur les loci d'expression de caractères quantitatifs(eLCQ); cependant, l'évaluation directe des variations régulatrices en cis nécessite des approches allèle-spécifique (cis-rSNPs). La mesure de l'expression allélique (EA) est très efficace puisque les perturbations environnementales et les influences en trans sont réduites. Les résultats indiquent que les différences d'EA peuvent affecter jusqu'à 30% des loci chez un individu. Les polymorphismes responsable de telles variations peuvent être identifiés par cartographie des différences d'EA en utilisant des puces de génotypage Illumina. Ainsi, plus de 50% de la variance en EA de la population est expliqué par la cartographie des cis-rSNPs. Des études ont montré que ces cis-rSNPs ont été impliqués dans des différences de liason de facteurs de transcription (FT). Celà suggère que l'étude du mode d'action de ces FT pourrait être approfondie par l'utilisation comme outil des polymorphismes dans la population. Nous avons appliqué cette approche au FT NF-κB et analysé les conséquences de l'inactivation de ce gène à l'échelle du genome. Des données récentes montrent l'implication de NF-κB dans la réponse immunitaire et son motif de liaison à l'ADN est retrouvé enrichi dans les cellules lymphoblastoïdes humaines (LCL), surtout au niveau des promoteurs et des activateurs transcriptionnels. Nous avons croisé les cis-rSNPs cartographiés dans des LCLs des populations HapMap YRI et CEU, ainsi que des SNPs de contrôles, avec des données d'immunoprécipitation de chromatine suivi de séquençage à haut débit (ChIP-seq) utilisant l'anticorps NF-κB du projet ENCODE et accessible au public. Des analyses préliminaires des régions contenant les cis-rSNPs candidats ont montré un enrichissement des sites de liaison pour le facteur NF-κB par rapport aux sites contrôles. En effet, 39% des sites candidats sont situés dans un site de liaison pour NF-kB. Afin d'étudier le rôle potentiel des cis-rSNPs sur l'EA différentielle, nous avons réalisé des expériences d'induction de TNF-α couplé à l'inhibition de NF-κB dans les LCLs suivie par l'analyses de l'EA sur des puces de génotypage Illumina 5M. Nous avons ensuite comparé ces données avec la cartographie de cis-rSNPs dans des LCLs générée dans notre laboratoire.Nos données sont composées de cis-rSNPs associés à l'EA différentielle de loci suite à la perturbation de NF-κB et classés par valeur p (pv; top10= les 10 valeurs les plus significatives) et ont été croisées avec des données accessibles au public. Ces données sont composées des coordonnées de pics de ChIP-seq et des sites de liaison TRANSFAC pour le facteur NF-κB et de ses co-régulateurs transcriptionnels connus. Les loci montrant des différences d'EA suite à la perturbation de NF-κB et avec 1 ou plusieurs des cis-rSNPs (« top3 » pv) hétérozygotes dans les individus étudiés étaient aux nombre de 581. La recherche de ces cis-rSNPs « top 3 » dans les sites de liaison (pics de ChIP-seq) dans les LCLs ou dans un site de TRANSFAC pour NF-κB ou pour un de ses co-régulateurs transcriptionnels montrent un enrichissement significatif (64% des loci) avec un ratio supérieur à 5 par rapport aux SNPs de contrôles.L'analyse bioinformatique suggère que les SNPs identifiés sont essentiels pour la liason de NF-κB. Une étude complémentaire à consisté à perturber le FT SNAI1 probablement associé au gène WNT4 et présentant un rôle important dans les fibroblastes (FB). Cependant, nous n'avons pas été en mesure de reproduire l'effet de SNAI1 sur WNT4 in vivo.Nous avons ensuite comparé les rôles régulateurs de NF-κB et de SNAI1 dans les LCLs et les FBs respectivement (par inactivation de ces gènes). Nous avons observé que NF-κB a un effet régulateurs sur environ 33% des loci dans les LCLs contre seulement 2 % pour SNAI1 dans des FBs.Cette étude supporte l'utilisation de perturbations de l'expression de FT pour étudier le rôle clé de FTs régulateurs dans un type cellulaire donné.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.114371
Date January 2013
CreatorsSchiavi, Alicia
ContributorsTomi Markku Pastinen (Internal/Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageEnglish
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (Department of Human Genetics)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0021 seconds