Spelling suggestions: "subject:"ariants rares"" "subject:"rariants rares""
1 |
Etude de la composante génétique de la Polyarthrite Rhumatoïde par séquençage d'exomes : contribution des variants rares / Study of Rheumatoid Arthritis genetic component by exome sequencing : contribution of rare variantsVeyssiere, Maëva 23 October 2019 (has links)
La Polyarthrite Rhumatoïde (PR) est une maladie auto-immune inflammatoire complexe qui touche près de 0,3% de la population française. A ce jour, malgré l'identification d'un facteur génétique majeur (HLA-DRB1), et d'une centaine de facteurs de susceptibilité d'effet faible à modéré (majoritairement identifiés par des études d'associations pangénomiques - GWAS), on ne peut expliquer au plus que 50% de la composante génétique de la maladie. Les GWAS se focalisant sur les variants fréquents (fréquence de l'allèle mineure (MAF) ≥ 1%) et considérant l'effet de ces variants comme indépendants, nous avons cherché dans ces travaux à identifier de nouveaux facteurs génétiques de la PR via l'analyse de variants rares (variants d'un seul nucléotide (SNVs) ou petites insertions et délétions (InDels)) pour lesquels peu d'études sont référencées dans la littérature. Nous avons ensuite étudié les interactions gène/gène (GxG) dans des voies biologiques enrichies par les variants rares identifiés.Pour cela, nous avons travaillé sur deux jeux de données obtenus par séquençage d'exomes. Dans le premier échantillon (data1), nous avons cherché à évaluer la contribution des variants rares dans 1080 gènes candidats séquencés chez 240 cas et 240 témoins français. Dans le second échantillon (data2), notre objectif était d'identifier de nouveaux facteurs génétiques par l'analyse de variants rares chez 30 individus (dont 19 atteints) appartenant à 9 familles françaises à cas multiples de PR. Nous avons mis en place un workflow afin de réaliser toutes les étapes de traitement des séquences obtenues jusqu'à l'identification des variants (alignement des lectures sur la séquence de référence du génome humain GRCh37, nettoyage de l'alignement, identification des variants (SNV et Indels) et filtre qualité des variants identifiés).Avec data1, nous avons répliqué l'association entre la PR et le gène BTNL2 (p-value = 3,0E-6) et identifié trois nouveaux gènes à risque (p-value ≤ 4,0E-3), impliqués dans la différentiation et l'activation des cellules du système immunitaire, en combinant les multiples variants de fréquences faibles à modérées identifiés dans ces gènes (analyses d'association de type burden). Dans data2, nous avons effectué une étude d'association-liaison, par laquelle nous avons identifié 3 gènes - SUSD5, MNS1 et SMYD5 - présentant une agrégation de variants (rares et fréquents) associée à la PR (p-value < 0,04 après 10E6 permutations), et un gène nommé SUPT20H dont le signal d'association était porté par un seul variant rare à pénétrance complète dans une famille et sans phénocopie. Nous avons aussi mis en évidence, via une étude d'enrichissement, une agrégation de variants rares dans plusieurs voies biologiques dont l'adhésion focale. Dans cette voie, nous avons identifié 9 interactions candidates pour lesquelles plusieurs combinaisons génotypiques semblent conférer un risque supplémentaire de développer la PR (p-value ≤ 5,0E-5). / Rheumatoid arthritis (RA) is a complex inflammatory autoimmune disease affecting about 0.3% of French population. Today, despite the identification of a major genetic factor (HLA-DRB1), and more than one hundred susceptibility factors with low to moderate effect (mainly identified by Genome-Wide association studies - GWAS), we cannot explain more than 50% of RA genetic component. Knowing that GWAS only study frequent variants (minor allele frequency (MAF) ≥ 1%) and consider that all of them are independent, we tried to identify new RA genetic factors by focusing on rare variants (single nucleotide variants (SNVs) or small insertions and deletions (InDels)) for which, to date, only few studies has been conducted. In addition, we studied gene/gene interactions (GxG) in biological pathways enriched for rare susceptible variants.To this end, we worked on two datasets obtained by exome sequencing. With the first dataset (data1), we wanted to evaluate the contribution of rare variants to RA risk into 1080 candidate genes sequenced in 240 cases et 240 controls from French population. With the second dataset (data2), our aim was to identify new genetic factors by focusing on rare variants selected from 30 individuals (including 19 affected) belonging to 9 French multiplex families. We set up in the laboratory a workflow to process the produced sequences up to the identification of variants (read alignment on human reference genome GRCh37, alignment refinement, variant identification (SNV et Indels) and quality filters).In data1, we replicated the association between RA and BTNL2 gene (p-value = 3,0E-6) and identified 3 new RA risk genes (p-value ≤ 4,0E-3), involved in the differentiation and activation of immune system cells, by combining rare to low frequency variants (burden association analysis). In data2, with a linkage – association study, we identified 3 genes - SUSD5, MNS1 and SMYD5 – presenting an aggregation of rare and frequent variants associated with RA (p-value < 0.04 with 10E6 permutations), and another gene SUPT20H in which we identified one rare variant with complete penetrance in one of the family and without phenocopy. Finally, we identified, by enrichment analysis, several biological pathways presenting an aggregation of rare variants. In one of them (focal adhesion), we extracted 9 candidate GxG interactions for which multiple genotype combinations seem to increase RA risk (p-value ≤ 5,0E-5).
|
2 |
Étude des déterminants génétiques et moléculaires de la scoliose idiopathiqueNada, Dina 04 1900 (has links)
No description available.
|
3 |
Moving beyond Genome-Wide Association Studies / Comment aller au delà des études d'association à l'échelle du génome entierDelahaye-Sourdeix, Manon 14 November 2014 (has links)
Les études d'association à grande échelle consistent à étudier la corrélation de plusieurs millions de polymorphismes nucléotidiques avec un risque de cancer chez des milliers d'individus, sans avoir besoin de connaissances préalables sur la fonction biologique de ces variants. Ces études ont été utiles pour établir des hypothèses étiologiques et comprendre l'architecture génétique sous-jacente de plusieurs maladies humaines. Cependant, la plupart des facteurs héréditaires de ces maladies restent inexpliqués. Une partie de cette variation pourrait venir de variants rares qui ne sont pas ciblés par les puces de génotypage actuelles ou encore de variants avec un effet plus modéré voire faible pour lesquels une détection par les études d'association actuelles n'est pas envisageable. Dans ce contexte et comme illustré dans cette thèse, les récentes études d'association peuvent maintenant servir de point de départ pour de nouvelles découvertes, en mettant en place des stratégies innovantes pour étudier à la fois les variants rares et les maladies rares. Nous avons plus particulièrement exploré ces techniques dans le cadre du cancer du poumon, des voies aérodigestives et du lymphome de Hodgkins. L'utilisation de la bioinformatique pour combiner les résultats des études avec d'autres sources d'information, l'intégration de différents types de données génomiques ainsi que l'investigation de la relation entre altérations germinales et somatiques représentent les principales opportunités poursuivies dans ce travail de thèse / Genome-wide association (GWA) studies consist in testing up to one million (or more) single nucleotide polymorphisms (SNPs) for their association with cancer risk in thousands of individuals, without requiring any prior knowledge on the functional significance of these variants. These studies have been valuable for establishing etiological hypotheses and understanding the underlying genetic architecture of human diseases. However, most of the heritable factors of these traits remain unexplained. Part of this variation may come from rarer variants that are not targeted by current genotyping arrays or variants with moderate to low effects for which detection by current GWA studies is impractical. In this context and as illustrated in this thesis, GWA studies can now serve as starting points towards further discoveries, looking for new strategies to study both rarer variants and rarer diseases. We have specifically explored these approaches in the context of lung cancer, head and neck cancer and Hodgkin's lymphoma. The use of bioinformatics to combine recent GWA study results with other sources of information, the integration of different types of genomic data as well as the investigation of the interrelationship between germline and somatic alterations represent the main opportunities pursued in this thesis work
|
4 |
Caractérisation de l'étiologie génétique de patients atteints de différentes maladies neuromusculaires par l’intégration de données omiquesTriassi, Valérie 12 1900 (has links)
Les progrès des technologies de séquençage ont joué un rôle important dans le diagnostic moléculaire des maladies rares, telles que les myopathies et les dystrophies musculaires. Cependant, plusieurs patients atteints de maladies neuromusculaires restent sans diagnostic. Ceci est dû à la grande hétérogénéité clinique et génétique ainsi qu'au caractère hautement polymorphique des gènes associés à ces troubles. L'interprétation des données génétiques est un grand défi et les tests génétiques aboutissent souvent à l'identification de variants de signification inconnue (VUSs). Plusieurs de ces variants peuvent perturber l'épissage normal de l'ARN ou affecter l'expression des gènes. À cet égard, nous proposons une approche bio-informatique.
Notre objectif est de mettre en place un pipeline identifiant et caractérisant des variants d'intérêt dans un contexte pathologique. Afin de déterminer si les variants ont un impact fonctionnel, notre pipeline se concentre sur l'épissage alternatif ainsi que sur l'intégration des données génomiques et transcriptomiques. Nous émettons l'hypothèse qu'une partie des patients sans diagnostic pour leur maladie neuromusculaire s'explique par des variants introniques jouant un rôle régulateur ou affectant l'épissage et l'abondance de l'ARNm. Cette approche multi-omique permet de déterminer si les variants ont un impact fonctionnel.
Pour ce faire, nous avons réalisé un séquençage de l'ARN et de l'ADN à partir de biopsies musculaires de quatre patients. Les données ont été alignées et annotées avec différents scores de pathogénicité. Les événements d'épissage sont analysés par SpliceAI et rMATS. L'analyse des gènes différentiellement exprimés a été réalisée par l'outil LPEseq. Les CNVs et les expansions de répétitions ont été analysés avec CNVkit et ExpansionHunter. Plusieurs scripts maison filtrent et intègrent les données ARN et ADN. Pour l'instant, un total de huit variants pathogéniques sont proposés pour nos patients, mais des investigations supplémentaires sont nécessaires.
Les variants recherchés sont rares et nécessitent donc un pipeline cohérent et efficace. Ce projet apportera un bénéfice significatif pour les patients en leur permettant d'obtenir un diagnostic et ainsi d'avoir accès à un meilleur suivi clinique. / Advances in sequencing technologies have played an important role in the molecular diagnosis of rare diseases, such as myopathies and muscular dystrophies. However, several patients with these neuromuscular diseases remain undiagnosed. This is due to the great clinical and genetic heterogeneity as well as the highly polymorphic nature of the genes associated with myopathies and muscular dystrophies. The interpretation of genetic data is a great challenge and genetic testing often results in the identification of variants of uncertain significances (VUSs). Many of these variants can disrupt normal RNA splicing or affect gene expression. In this regard, we propose a bioinformatics approach.
Our aim is to put in place a pipeline identifying and characterizing variants of interest in a pathological context. To determine if the variants have a functional impact, our pipeline focuses on alternative splicing as well as the integration of genomic and transcriptomic data. We hypothesize that a portion of patients without a diagnosis for their neuromuscular disorder is explained by intronic variants having a regulatory role or affecting mRNA splicing and abundance. This multi-omics approach will make it possible to determine whether the variants have a functional impact.
To do so, we performed RNA and DNA sequencing using muscle biopsies from four patients. Data was aligned and annotated with different pathogenicity scores. Splicing events are analyzed by SpliceAI and rMATS. The analysis of the differentially expressed genes was carried out by the LPEseq tool. CNVs and repeat expansion were analyzed with CNVkit and ExpansionHunter. Several in-house scripts filter and integrate RNA and DNA data. For now, a total of eight pathogenic variants are proposed for our patients, but further investigations are needed.
The variants sought are rare and therefore require a coherent and efficient pipeline to facilitate their characterization. This project will have a significant benefit for patients by allowing them to obtain a diagnosis and thus have access to better clinical follow-up.
|
5 |
Bases génétiques de la dysplasie fibromusculaire : une approche d’étude d’exome et de génétique épidémiologique / Understanding the genetic basis of fibromuscular dysplasia using approaches of whole exome sequencing and genetic epidemiologyKiando, Soto Romuald 08 July 2016 (has links)
La dysplasie fibromusculaire artérielle (DFM) est un groupe de pathologies vasculaires non inflammatoires, et non athéromateuses de la paroi artérielle. Elle est caractérisée par la sténose, l'occlusion, l’anévrisme ou la dissection des artères de petit et moyen calibres, en particulier les artères rénales et le tronc supra-aortique. La DFM est un facteur de risque de l’hypertension et de l’accident vasculaire cérébral. Elle touche essentiellement les femmes (80% des cas) de moins de 50 ans. La prévalence en population générale est inconnue et les estimations varient de 0.4% pour les formes cliniques à 4% dans une cohorte de donneurs de reins. Une agrégation familiale a été démontrée et une composante génétique suggérée. L'objectif de mon travail de thèse était de caractériser les bases génétiques la DFM. Dans la première partie, nous avons analysé des variants génétiques rares générés par séquençage d'exomes chez 16 cas apparentés de DFM issus de 7 fratries. Aucun gène majeur n’était muté pour l’ensemble des fratries ou pour au moins 3 fratries sur 7. Cependant, nous avons pu mettre en évidence puis validé un enrichissement en variants rares à fort potentiel fonctionnel de quatre gènes candidats pour la DFM (MYLK, OBSCN, DYNC2H1, RNF213) en combinant l’approche de séquençage d’exomes et l’étude d’association gène entier de 62767 variants rares (MAF < 5%) générés par génotypage avec la puce Exome-chip chez 249 cas non apparentés de DFM et 689 témoins. Cependant, l’implication de ces gènes dans la DFM doit être confirmée dans d’autres familles, et par des études de validations fonctionnelles. Dans la seconde partie, nous avons étudié l'association avec la DFM de 25606 variants fréquents (MAF ≥ 5%) de l’Exome-chip. Les résultats majeurs obtenus ont été répliqués dans une première étude (402 cas de DFM et 2537 témoins) puis dans 3 autres études incluant 512 cas de DFM et 669 témoins. La méta-analyse de l’ensemble a permis d’associer à la DFM le polymorphisme rs9349379-A situé dans l’intron du gène PHACTR1 (OR=1,39 [1,39-1,54] ; P=7,36 ×10-10). Ce variant est aussi un facteur de risque pour la maladie coronaire, la migraine et la dissection de l’artère cervicale. Des études complémentaires conduites chez 2458 volontaires non malades ont permis de montrer que l’allèle à risque pour la DFM, rs9349379-A est associé avec une augmentation de l’épaisseur intima média (P=1,97×10-4) et du rapport de la paroi sur la lumière artérielle (P=0,002), deux paramètres décrits comme augmentés chez les cas de DFM dans des études antérieures. Ensuite, PHACTR1 a été détecté par immunohistochimie dans l’endothélium et les cellules musculaires lisses de carotides dysplasiques et non dysplasiques avec une expression augmentée de PHACTR1 pour les porteurs de l’allèle à risque de DFM dans des cultures primaires de fibroblastes humains (N=86, P=0,003). Enfin, l’invalidation de Phactr1 chez le poisson zèbre conduit à une dilatation des vaisseaux indiquant un défaut du développement vasculaire. Ce travail confirme le caractère multifactoriel et hétérogène de la DFM et ouvre de nouvelles perspectives pour évaluer l’ensemble de la variabilité génomique des patients de DFM par des approches massives de génétique épidémiologique. / Fibromuscular dysplasia (FMD) is a group of nonatherosclerotic and noninflammatory vascular diseases leading to stenosis, aneurysm, dissection and/or occlusion of medium-sized arteries, in particular the renal and extracranial cervical arteries. Clinical manifestations of FMD are hypertension, dizziness, pulsatile tinnitus, transient ischemic attack or stroke, according to the involved arterial beds. FMD occurs predominantly (80% of cases) in females under 50 years with a variable prevalence estimation from 0.4% for asymptomatic clinical relevant forms to 4% in potential renal donors. The pathogenesis of FMD is unknown and a genetic origin is suspected given its demonstrated familial aggregation. The aim of my thesis work was to characterize genetic basis of FMD. In the first part of this thesis, we analyzed whole exome sequencing data in 16 related FMD cases from seven families. No gene harbors variants that were shared by all affected members in at least three out seven families. Using combined strategy of whole exome sequencing and gene based association study of 62,767 rare variants (MAF < 5%) generated by Exome‐chip arrays in 249 unrelated FMD cases and 689 controls, we have identified and validated an enrichment of rare and putatively functional variants in four candidates genes (MYLK, OBSCN, DYNC2H1 and RNF213). This results need to be validated in other FMD families and by functional analysis. In the second part, we analyzed 25,606 common variants (MAF ≥ 5%) generated by Exome‐chip array. Top loci were replicated in first replication study (402 cases and 2,537 controls) and in 3 others studies (512 cases and 669 controls). Meta-analysis of all including 1,154 unrelated FMD cases and 3,895 controls allowed identification of association between FMD and rs9349379-A (OR=1.39 [1.39-1.54]; P=7.4×10‐10). rs9349379 is intronic to PHACTR1, a risk locus for coronary artery disease, migraine, and cervical artery dissection. The analyses of geometrical parameters of carotids from 2,458 healthy volunteers indicated higher intima media thickness (P = 1.97×10‐4) and wall to lumen ratio (P = 0.002) in rs9349379‐A carriers, suggesting indices of carotid hypertrophy as previously described in carotids of FMD patients. Immunohistochemistry detected PHACTR1 in endothelium and smooth muscle cells of FMD and normal human carotids. The expression of PHACTR1 by genotypes in primary human fibroblasts showed higher expression in rs9349379‐A carriers (N=86, P=0.003). Phactr1 knockdown in zebrafish resulted in dilated vessels indicating subtle impairment of vascular development. This work confirms the multifactorial and heterogeneous genetic architecture of the FMD and opens new opportunities to evaluate all of genomic variability of FMD patients with massive genetic epidemiology approaches.
|
6 |
Recherche des facteurs génétiques contrôlant la réponse à l’infection par Mycobacterium tuberculosis et le développement d’une tuberculose maladie / Search for genetic factors controlling the response to infection by Mycobacterium tuberculosis and the development of clinical tuberculosisJabot-Hanin, Fabienne 12 October 2017 (has links)
La tuberculose, causée par Mycobacterium tuberculosis, connaît actuellement une résurgence inquiétante, et l’OMS estime à plus de 10 millions le nombre de nouveaux cas cliniques en 2015 avec environ 1,8 millions de décès dus à la maladie. Environ un tiers de la population mondiale est exposée à M.tuberculosis, et après exposition, la plupart des individus sont infectés par la mycobactérie. La grande majorité (~90%) des individus infectés ne présentera jamais de symptomatologie clinique. Parmi les 10% qui développent la maladie, environ la moitié le fera dans les deux années suivant l’infection, ce qui est en général considéré comme une forme primaire de tuberculose. Les autres patients présenteront leur maladie à distance de l’infection primaire (parfois plusieurs dizaines d’années plus tard) ; il s’agit des formes pulmonaires classiques de l’adulte. Chez l’homme, le rôle de certains facteurs génétiques a été maintenant démontré dans le développement d’une tuberculose active, à la fois la tuberculose pulmonaire de l’adulte et les formes plus disséminées de l’enfant, et aussi dans le contrôle de l’infection tuberculeuse. Cependant, la plus grande part de ces facteurs génétiques reste à identifier. Le premier objectif de ma thèse était d'identifier les facteurs génétiques de l'hôte modulant les phénotypes immunologiques de production d'Interféron gamma in vitro (IGRA) après exposition à M. tuberculosis dans un échantillon de 590 individus ayant été en contact avec un cas avéré de tuberculose dans le Val de Marne, en région parisienne. Puis, dans un second temps, de voir si les facteurs trouvés pouvaient être répliquées dans un échantillon familial d'Afrique du Sud, zone de très forte endémie tuberculeuse. Pour cela, j'ai tout d'abord réalisé des analyses de liaison génétique à l'échelle du génome entier sur plusieurs phénotypes quantitatifs d'IGRA. Celles-ci ont permis de mettre en évidence 2 loci majeurs (p < 10-4) répliqués en Afrique du Sud et liés à la production d'interféron gamma induite pour l’un par le bacille du BCG, et pour l’autre, par la part spécifique de l'antigène ESAT6 de M. tuberculosis (absent de la plupart des mycobactéries environnementales et du BCG), indépendamment de la capacité intrinsèque de réponse aux mycobactéries. La seconde étape a consisté en la réalisation d'une étude d'association sur les régions de liaison ainsi identifiées. Un variant associé au phénotype spécifique de l’ESAT6 (p < 10-5) a ainsi été trouvé, variant contribuant de manière significative au pic de liaison précédemment découvert (p<0.001) et ayant été rapporté comme modulant l’expression du gène ZXDC. Le second objectif de la thèse concernait l’identification de variants génétiques rares sous-jacents à la déclaration d’une tuberculose pulmonaire chez les individus infectés par le bacille. A cette fin, j’ai comparé les exomes de 120 patients tuberculeux à ceux de 136 individus infectés par le bacille mais non malades, tous originaires du Maroc. Cette étude m’a permis d’identifier le gène BTNL2, en bordure de la région HLA, dans lequel près de 10% des patients comportaient un variant rare perte de fonction contrairement aux contrôles qui n’en présentaient aucun. / Tuberculosis remains a major public health concern, with approximately 10.4 million new cases and 1.8 million deaths due to the disease in 2015 according to WHO. While an estimated one third of the world population is estimated to be infected with Mycobacterium tuberculosis, only about 10% of infected individuals go on to develop a clinical disease. Among them, half will declare the disease in the 2 years following infection, which is generally considered as primary tuberculosis. The other patients will develop the disease more distant in time of primary infection, sometimes several tens of years latter; these are classical pulmonary forms in adults. In humans, the role of genetic factors have been demonstrated in the development of active tuberculosis, in pulmonary forms as in disseminated forms in childhood, et also in the control of M.tuberculosis infection. Nevertheless, most of these genetic factors remain to identify. The first aim of my PhD was to identify genetic factors controlling in vitro interferon-gamma production phenotypes (IGRA) after exposure to M.tuberculosis in a sample of 590 subjects who were in contact with a proven tuberculous patient in Val-de-Marne, Paris suburbs, and in a second time, to try to replicate the findings in a south African familial sample where the tuberculosis is highly endemic. For this purpose, I first performed genome-wide genetic linkage analysis for several quantitative IGRA phenotypes. They led to identify 2 major loci (p<10-4) replicated in South-Africa and linked to the interferon-gamma production induced by live BCG for the first one, and for the second one, by the specific part of the ESAT6 antigen of M.tuberculosis (absent from most of environmental mycobacteria and from BCG), independently of intrinsic ability to respond to mycobacteria. The second step was an association study in the identified linkage regions. A variant associated to the specific ESAT6 phenotype was found (p<10-5), which was significantly contributing to the linkage peak (p<0.001) and previously reported as eQTL of ZXDC gene. The second objective of my PhD was the identification of rare genetic variants underlying the development of pulmonary tuberculosis in infected individuals. To this end, I compared exome data from 120 tuberculous patients and 136 infected individuals without any clinical symptoms. All of them were from Morocco. This study resulted in the lighting of BTNL2 gene, very closed to the HLA region, in which around 10% of patients had a rare loss of function variant whereas the controls didn’t have any.
|
Page generated in 0.0729 seconds