1 |
Etude de la composante génétique de la Polyarthrite Rhumatoïde par séquençage d'exomes : contribution des variants rares / Study of Rheumatoid Arthritis genetic component by exome sequencing : contribution of rare variantsVeyssiere, Maëva 23 October 2019 (has links)
La Polyarthrite Rhumatoïde (PR) est une maladie auto-immune inflammatoire complexe qui touche près de 0,3% de la population française. A ce jour, malgré l'identification d'un facteur génétique majeur (HLA-DRB1), et d'une centaine de facteurs de susceptibilité d'effet faible à modéré (majoritairement identifiés par des études d'associations pangénomiques - GWAS), on ne peut expliquer au plus que 50% de la composante génétique de la maladie. Les GWAS se focalisant sur les variants fréquents (fréquence de l'allèle mineure (MAF) ≥ 1%) et considérant l'effet de ces variants comme indépendants, nous avons cherché dans ces travaux à identifier de nouveaux facteurs génétiques de la PR via l'analyse de variants rares (variants d'un seul nucléotide (SNVs) ou petites insertions et délétions (InDels)) pour lesquels peu d'études sont référencées dans la littérature. Nous avons ensuite étudié les interactions gène/gène (GxG) dans des voies biologiques enrichies par les variants rares identifiés.Pour cela, nous avons travaillé sur deux jeux de données obtenus par séquençage d'exomes. Dans le premier échantillon (data1), nous avons cherché à évaluer la contribution des variants rares dans 1080 gènes candidats séquencés chez 240 cas et 240 témoins français. Dans le second échantillon (data2), notre objectif était d'identifier de nouveaux facteurs génétiques par l'analyse de variants rares chez 30 individus (dont 19 atteints) appartenant à 9 familles françaises à cas multiples de PR. Nous avons mis en place un workflow afin de réaliser toutes les étapes de traitement des séquences obtenues jusqu'à l'identification des variants (alignement des lectures sur la séquence de référence du génome humain GRCh37, nettoyage de l'alignement, identification des variants (SNV et Indels) et filtre qualité des variants identifiés).Avec data1, nous avons répliqué l'association entre la PR et le gène BTNL2 (p-value = 3,0E-6) et identifié trois nouveaux gènes à risque (p-value ≤ 4,0E-3), impliqués dans la différentiation et l'activation des cellules du système immunitaire, en combinant les multiples variants de fréquences faibles à modérées identifiés dans ces gènes (analyses d'association de type burden). Dans data2, nous avons effectué une étude d'association-liaison, par laquelle nous avons identifié 3 gènes - SUSD5, MNS1 et SMYD5 - présentant une agrégation de variants (rares et fréquents) associée à la PR (p-value < 0,04 après 10E6 permutations), et un gène nommé SUPT20H dont le signal d'association était porté par un seul variant rare à pénétrance complète dans une famille et sans phénocopie. Nous avons aussi mis en évidence, via une étude d'enrichissement, une agrégation de variants rares dans plusieurs voies biologiques dont l'adhésion focale. Dans cette voie, nous avons identifié 9 interactions candidates pour lesquelles plusieurs combinaisons génotypiques semblent conférer un risque supplémentaire de développer la PR (p-value ≤ 5,0E-5). / Rheumatoid arthritis (RA) is a complex inflammatory autoimmune disease affecting about 0.3% of French population. Today, despite the identification of a major genetic factor (HLA-DRB1), and more than one hundred susceptibility factors with low to moderate effect (mainly identified by Genome-Wide association studies - GWAS), we cannot explain more than 50% of RA genetic component. Knowing that GWAS only study frequent variants (minor allele frequency (MAF) ≥ 1%) and consider that all of them are independent, we tried to identify new RA genetic factors by focusing on rare variants (single nucleotide variants (SNVs) or small insertions and deletions (InDels)) for which, to date, only few studies has been conducted. In addition, we studied gene/gene interactions (GxG) in biological pathways enriched for rare susceptible variants.To this end, we worked on two datasets obtained by exome sequencing. With the first dataset (data1), we wanted to evaluate the contribution of rare variants to RA risk into 1080 candidate genes sequenced in 240 cases et 240 controls from French population. With the second dataset (data2), our aim was to identify new genetic factors by focusing on rare variants selected from 30 individuals (including 19 affected) belonging to 9 French multiplex families. We set up in the laboratory a workflow to process the produced sequences up to the identification of variants (read alignment on human reference genome GRCh37, alignment refinement, variant identification (SNV et Indels) and quality filters).In data1, we replicated the association between RA and BTNL2 gene (p-value = 3,0E-6) and identified 3 new RA risk genes (p-value ≤ 4,0E-3), involved in the differentiation and activation of immune system cells, by combining rare to low frequency variants (burden association analysis). In data2, with a linkage – association study, we identified 3 genes - SUSD5, MNS1 and SMYD5 – presenting an aggregation of rare and frequent variants associated with RA (p-value < 0.04 with 10E6 permutations), and another gene SUPT20H in which we identified one rare variant with complete penetrance in one of the family and without phenocopy. Finally, we identified, by enrichment analysis, several biological pathways presenting an aggregation of rare variants. In one of them (focal adhesion), we extracted 9 candidate GxG interactions for which multiple genotype combinations seem to increase RA risk (p-value ≤ 5,0E-5).
|
Page generated in 0.1165 seconds