• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 41
  • 14
  • 5
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 71
  • 71
  • 69
  • 26
  • 22
  • 11
  • 11
  • 10
  • 9
  • 9
  • 9
  • 9
  • 8
  • 8
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
61

Caractérisation phénotypique et moléculaire des dysplasies frontonasales / Phenotypic and molecular characterization of frontonasal dysplasias

Lehalle, Daphné 05 December 2017 (has links)
Les dysplasies frontonasales (DFN) sont un groupe de malformations rares de la face résultant d’une anomalie de développement du processus frontonasal, et se manifestant cliniquement par l’association variable d’une fente faciale médiane, d’un hypertélorisme, et d’anomalies nasales. Elles s’intègrent généralement dans un cadre syndromique, la plupart étant peu spécifiques et non caractérisées. Une douzaine d’entités ont été décrites ; les bases moléculaires sont connues pour sept d’entre elles seulement. Pour les autres entités, les hypothèses initiales étaient celles de pathologies autosomiques dominantes liées à des mutations de novo.Ce travail s’est fondé sur une cohorte de 80 patients présentant une DFN, recrutés au niveau national et international, avec l’objectif d’identifier les bases moléculaires de plusieurs entités de DFN. Une caractérisation phénotypique a d’abord été effectuée. Deux stratégies moléculaires ont ensuite été poursuivies en parallèle : une approche « phenotype-first », visant à étudier les patients classés par cohortes homogènes cliniquement, et une approche « genotype-first », visant à réaliser des études moléculaires chez des patients présentant un tableau aspécifique.Lorsque le diagnostic était celui d’un syndrome dont le gène causal était connu, nous avons réalisé un séquençage ciblé dudit gène (EFNB1, ZSWIM6). Nous avons effectué un séquençage haut-débit d’exome (SHD-E) chez 11 patients présentant un syndrome de Pai (5 en trio, 5 en solo, un en profondeur sur tissu atteint en paire), trois patients avec syndrome oculoauriculofrontonasal (en trio), et respectivement un patient avec syndrome oculocérébrocutané et syndrome de Teebi (en trio). Nous avons réalisé un séquençage haut-débit de génome (SHD-G) chez 3 patients avec un syndrome de Pai, ainsi qu’une patiente avec syndrome oculoauriculofrontonasal. Enfin, nous avons séquencé les gènes ALX1, ALX3 et ALX4 chez 13 individus avec DFN aspécifique ; réalisé un SHD-E en profondeur chez une patiente avec DFN et hypomélanose d’Ito, ainsi que trois SHD-E en trio chez des patients avec DFN aspécifique ou non classée.Nous avons réalisé un travail de caractérisation phénotypique des patients de la cohorte, décrivant les diagnostics différentiels principaux et les chevauchements phénotypiques. Nous avons décrit une nouvelle entité de DFN, identifiée chez 4 de nos patients, sans base moléculaire à l’heure actuelle. Nous avons confirmé les diagnostics cliniques lorsque le gène causal était connu, chez 5 patients. Nous avons retrouvé des variants candidats dans deux gènes de la voie du TGFβ chez quatre patients avec syndrome de Pai : un de novo dans le gène TGFBRAP1, deux de novo et un hérité d’un parent asymptomatique dans le gène PCSK7. Nous avons identifié les mutations dans TFE3 comme étant à l’origine d’un syndrome neurocutané de mosaïcisme pigmentaire chez une patiente et 6 patients additionnels. Enfin, nous avons identifié un variant dans le gène POLR2A chez un fœtus avec DFN aspécifique. Au total, 34 individus avec un syndrome connu et 34 avec une DFN aspécifique restent à l’heure actuelle sans piste moléculaire identifiée.Au total, ce travail a permis de démontrer l’intérêt d’une meilleure connaissance clinique de ces syndromes rares, pour le diagnostic et le conseil génétique. Il a permis l’individualisation et la description de deux syndromes pouvant s’accompagner d’une DFN – dont un à l’échelle moléculaire –, et la démonstration du rôle du gène TFE3 dans le développement. Enfin, des hypothèses sont émises concernant les résultats incertains et négatifs : celles d’un oligogénisme, d’une anomalie épigénétique, d’une mutation post-zygotique ou de l’influence de l’environnement. / Frontonasal dysplasias (FND) are a group of rare facial malformations due to an abnormal development of the frontonasal process, clinically resulting in the variable association of median facial cleft, hypertelorism and nasal anomalies. Most of them are syndromic, but non-specific and not characterized. A dozen entities have been described; molecular bases are known for only seven of them. Regarding the other entities, the hypothesis of dominant disorders due to de novo mutations had been raised.This work was based on a cohort of 80 patients presenting with FND, nationally and internationaly recruited with the goal of identifying molecular bases of FND entities. We first phenotypically characterized the individuals. Then two molecular strategies were performed in parallel: a “phenotype-first” approach, aiming to study clinically homogeneous cohorts of patients, and a “genotype-first” approach, aiming to perform molecular studies on patients with an aspecific phenotype.When the causative gene for the disorder was known, we performed targeted sequencing of the gene (EFNB1, ZSWIM6). We performed whole-exome sequencing (WES) in 11 patients presenting with Pai syndrome (5 trio WES, 5 solo WES, one deep-sequencing pair-WES on affected tissue), 3 individuals presenting with oculoauriculofrontonasal syndrome (OAFNS) (trio WES), and respectively one patient with oculocerebrocutaneous syndrome and Teebi syndrome (both trio WES). We performed whole-genome sequencing (WGS) on 3 patients with Pai syndrome and one patient with OAFNS. Finally, we performed ALX1, ALX3 and ALX4 genes sequencing in 13 individuals with aspecific FND; deep-WES in one patient with FND and Ito hypomelanosis; as well as 3 trio WES in individuals with aspecific or non characterized FND.We achieved a phenotypic characterization of the patients from the cohort, describing major differential diagnosis and clinical overlaps. We described a new FND entity, identified in 4 individuals, with no molecular basis so far. We confirmed the clinical diagnosis when the causative gene was known, for 5 patients. We identified candidate variants in two genes from the TGFβ pathway in four patients with Pai syndrome: one de novo variant in the TGFBRAP1 gene, two de novo and one inherited from an asymptomatic parent in the PCSK7 gene. We identified mutations in TFE3 as causative for a neurocutaneous syndrome of pigmentary mosaicism in a female patient and six additional individuals. Finally, we identified a variant in the POLR2A gene in a fetus with aspecific FND. A total of 34 individuals with a known syndrome and 34 with an aspecific FND still have no identified molecular basis so far.In conclusion, this work allowed proving the importance of a better clinical knowledge of these rare disorders, in terms of diagnosis and genetics counseling. It allowed the delineation of two syndromes with FND – one at a molecular level –, and the demonstration of a role for TFE3 in development. Finally, four hypotheses are raised regarding the negative or uncertain results: oligogenism, epigenetic anomaly, post-zygotic mutation or environmental influence.
62

Caractérisation moléculaire et fonctionnelle de cellules tumorales circulantes dans le cancer de la prostate et le cancer bronchique non à petites cellules / Molecular and functional characterization of circulating tumor cells in prostate cancer and non small cell lung cancer

Faugeroux, Vincent 12 December 2017 (has links)
Les cellules tumorales circulantes (CTC) représentent une source de matériel tumoral accessible de manière non invasive, susceptible de fournir des informations cliniques et fondamentales. Ces cellules issues de tumeurs primitives ou métastatiques représentent une population hétérogène d’éléments très rares circulant dans le sang. La personnalisation des traitements en oncologie repose sur la caractérisation moléculaire de biopsies tumorales mais celles-ci peuvent être difficiles à réaliser ou peu informatives. De ce fait, la caractérisation moléculaire et fonctionnelle des CTC présente un double intérêt, clinique pour identifier des biomarqueurs de sensibilité à des traitements, et fondamental pour étudier les mécanismes qui sous-tendent leur potentiel à initier des tumeurs.Les objectifs de ma thèse ont été d’une part de caractériser par séquençage de l’exome (WES) les CTC à l’échelle de cellule unique de patients atteints de cancers de la prostate (PCa) métastatiques et d’autre part d’établir puis caractériser des modèles de xénogreffes dérivés de CTC (CDX) chez des patients atteints de cancers bronchiques non à petites cellules (CBNPC) ou de PCa.Pour répondre au premier objectif, nous avons développé une méthode expérimentale globale incluant trois approches technologiques permettant d’enrichir et d’isoler des CTC individuelles de différents phénotypes (épithélial, épithélio-mésenchymateux et mésenchymateux), d’amplifier la totalité du génome (WGA) et de le séquencer. Le WES a été réalisé pour 34 échantillons de CTC sélectionnés sur des critères de qualité du WGA, ainsi que pour les biopsies de métastases correspondantes chez sept patients. Deux patients présentant une hétérogénéité phénotypique de leurs CTC, ont été analysés en profondeur. Nous avons mis en évidence des mutations partagées entre les CTC et les biopsies tumorales correspondantes ainsi que des mutations uniquement retrouvées dans les CTC. Ces mutations spécifiques aux CTC sont présentes dans tous les phénotypes et affectent particulièrement les gènes impliqués dans le remodelage du cytosquelette, la réparation de l’ADN ou l’invasion. L’existence de mutations communes entre les CTC de différents phénotypes suggère une relation phylogénique entre ces cellules mais une évolution divergente pendant le processus métastatique. Ce travail est soumis pour publication.Dans la seconde partie de ma thèse, nous avons implantés les CTC de 67 patients atteints de CBNPC et 24 patients atteints de PCa chez des souris immunodéprimées. Nous avons établis quatre CDX de CBNPC et un CDX de PCa. La caractérisation de ces modèles, des biopsies tumorales, des CTC collectées au moment de la xénogreffe, des CDX et des lignées cellulaires établies à partir du CDX, ont révélé que les CTC, le CDX et les lignées cellulaires « miment » le phénotype et le profil mutationnel des biopsies tumorales. La caractérisation plus approfondie de l’une des lignées cellulaires montre la présence d’un stress réplicatif et d’une instabilité génomique élevée. Ce résultat nous oriente sur l’hypothèse d’un rôle éventuel de l’instabilité génomique dans la tumorigénicité des CTC.Dans ce travail, nous avons montré que le profil mutationnel des CTC présente de fortes similitudes avec les biopsies tumorales des patients dans les patients atteints de PCa étudiés. De plus, nous avons observé l’existence de mutations spécifiques aux CTC, non détectées dans les biopsies tumorales. Également, nous montrons que des CTC issues de CBNPC et de PCa sont tumorigéniques in vivo et qu’elles reflètent le profil mutationnel des biopsies tumorales des patients. Ces modèles constituent des outils originaux et intéressants pour identifier de nouvelles cibles thérapeutiques et stratégies anti-cancéreuses, et comprendre les mécanismes qui supportent le potentiel des CTC à initier des tumeurs. / Circulating tumor cells (CTCs) represents an non invasive source of tumor material which may provide clinical and basic information. These cells derived from primary or metastatic tumors represents an heterogeneous population of very rare events which circulates in the blood. Oncology personnalized medicine is based on biopsies molecular characterization but these are sometimes which difficult to realize and poorly informative. Thereby molecular and functional characterization of CTCs presents a double interest, clinical to identify treatments biomarkers sensitivity and basic to study mechanisms underlying their tumor inititiating cell (TIC) potential. The two goals of my thesis were on the one hand to characterize by whole-exome sequencing (WES) at the single level the CTCs from patients with metastatic prostate cancers (mPCa) and on the other hand to establish and characterize CTC-derived xenografts (CDX) from patients with non-small-cell lung cancer (NSCLC) or mPCa. For the first goal we developped a global workflow which include three technological approaches to enrich and isolate individual CTCs from different phenotype (epithelial, epithelial and mesenchymal, mesenchymal), to perform whole genome amplification (WGA) and to sequence them. WES was performed on 34 CTC samples selected according to WGA quality and on corresponding metastasis biopsies from seven patients. Two patients with phenotypic heterogeneity of CTCs were deeply analyzed. We highlighted shared mutations between CTCs and matched biopsies as well as mutations only detected in CTCs. These private CTC mutations are detected in all phenotype and particularly affect genes invlved in cytoskeleton remodeling, DNA repair or invasion. The existence of common mutations between CTCs from various phenotype suggests a phylogenic link between these cells but a divergent evolution during metastatic process. This work is submitted for publication. For the second goal, we implanted CTCs from 67 NSCLC patients and 28 mPCa patients in immunocompromised mice. We established four NSCLC CDX and one mPCa CDX. The characterization of tumor biopsies, CTCs collected at the time of xenograft, CDX and CDX-derived cell lines revealed that CTCs, CDX and cell lines miror the phenotype and mutational landscape of tumor biopsies. The more deeply characterization of one cell line show the presence of a high replicative stress and genomic instability. This result directs us to the hypothesis of a possible role of the genomic instability in CTC tumorigenicity.We demonstrated in this work that CTCs mutational landscape harbors high similairities with patients tumor biopsies in mPCa. Furthermore we observed CTC private mutations not detected in tumor biopsies. Also we showed that some CTCs from NSCLC and mPCa are tumorigenic in vivo and that these CTCs mirror mutational profile of patients tumor biopsies. These models are original and interesting tools to identify new therapeutic targets and anti-tumoral strategies and understand mechanisms underlying the TIC potential of CTCs.
63

Morphogenèse de la thyroïde : de l'humain au poisson-zèbre

Larrivée Vanier, Stéphanie 11 1900 (has links)
L’hypothyroïdie congénitale (HC), qui se traduit par une insuffisance d’hormone thyroïdienne (HT) à la naissance, est la maladie endocrinienne congénitale la plus fréquente avec une prévalence d’un cas sur 2,500 naissances vivantes. Non-traitée, cette insuffisance peut entrainer un retard de développement sévère, surtout au niveau cognitif. L’HC est le plus souvent due à un défaut lors du développement de la thyroïde (dysgénésie thyroïdienne (DT)) ou lors de la production des hormones thyroïdiennes (dyshormonogenèse (D)). La majorité des cas d’HC par dysgénésie thyroïdienne (HCDT) ont une ectopie, soit une glande mal positionnée. Contrairement aux dyshormonogenèses, qui s’expliquent fréquemment par des mutations dans les gènes responsables de la production des HT, selon un modèle autosomique récessif, les causes de l’HCDT demeurent largement inconnues. Certains arguments sont en faveur d’une prédisposition génétique (le risque relatif chez les parents de premier degré est de 40 fois supérieur à celui de la population générale) mais l’HCDT ne suit pas un modèle Mendélien: 98 % des cas sont sporadiques et 92 % des jumeaux monozygotiques sont discordants pour l’HCDT. De ce fait, nous avons suggéré une hypothèse de double-hit pour expliquer les HCDT, hypothèse combinant une prédisposition germinale (héritée ou de novo) à un évènement somatique (génétique ou épigénétique). Par le passé, nous avons étudié l’évènement somatique, mais nous n’avions pas encore étudié la prédisposition germinale. Le séquençage d’exome complet peut permettre d’identifier la cause génétique dans des formes familiales d’HC, mais aussi déterminer si les cas avec une HCDT isolée sont enrichis en variants délétères, tel qu’observé chez des patients avec une malformation cardiaque congénitale, patients qui partagent des caractéristiques similaires avec ceux atteints d’HCDT. De plus, cette technique pourrait permettre d’identifier de nouveaux gènes de prédisposition associés à l’HCDT. D’une part, nous avons séquencé l’exome d’un trio (parent-enfant) afin d’identifier la cause de l’HC dans une famille avec plusieurs enfants sévèrement atteints d’HC. D’autre part, nous avons comparé les données d’exome d’une cohorte de cas avec une HCDT isolée (HCDT non syndromique, HCDT-NS) à celles d’une cohorte contrôle, à l’aide d’une approche biaisée (gene-based burden) et non biaisée (gènes candidats). Finalement, nous avons développé le modèle de poisson-zèbre afin de pouvoir valider, in vivo, l’implication de potentiels gènes candidats, dans le développement thyroïdien. L’analyse de l’exome du trio a révélé un variant dans le gène TSHR qui co-ségrégait parfaitement avec le phénotype, et les études de minigène ont permis de montrer que ce variant intronique loin des sites d’épissage traditionnels introduisait un pseudo-exon dans la séquence du TSHR, créant ainsi un récepteur tronqué et inactif. L’analyse par comparaison de cohorte (cas-contrôle) a montré que les cas avec une HCDT-NS n’ont pas davantage de variants rares délétères comparé aux contrôles. De plus, après correction, le gene-based burden n’a pas identifié de gène candidat. Par contre, des variants rares pathogéniques ou probablement pathogéniques dans des gènes liés à l’hypothyroïdie congénitale ont été identifiés chez 42% des cas. Les études réalisées chez le poisson-zèbre sur un gène candidat, IKBKE, identifié par une analyse préliminaire de l’exome dans la cohorte de cas, confirme que les vaisseaux sanguins sont importants pour le bon positionnement de la glande thyroïde chez le poisson-zèbre, mais ne permet pas d’établir le rôle d’IKBKE dans la migration thyroïdienne. Nous avons d’abord montré que l’exome est une bonne technique pour identifier la cause de l’HC dans une famille avec plusieurs enfants atteints. Toutefois, une connaissance approfondie de la maladie et des isoformes du gène d’intérêt s’est avérée essentielle afin de bien analyser les données d’exome. Ensuite, nos résultats suggèrent que les cas avec une HCDT-NS n’ont pas davantage de variants délétères que les contrôles et que l’exome complet n’est pas suffisant pour identifier des gènes de prédisposition. Le séquençage du génome est peut-être nécessaire pour trouver une prédisposition génétique à l’HCDT-NS. Par contre, il est aussi possible que la génétique ne joue pas un rôle majeur dans les dysgénésies thyroïdiennes. Finalement, nous avons validé que le poisson-zèbre est un bon modèle pour étudier le développement de la thyroïde. / Congenital hypothyroidism (CH) is a disorder with a prevalence of one in 2,500 live births. CH can lead to severe intellectual disability if left untreated. It is most commonly caused by a defect during thyroid development (thyroid dysgenesis), which results in an ectopic gland in the majority of cases. A defect in thyroid hormone production (dyshormonogenesis) is the second most common cause of CH. In contrast to dyshormonogenesis, which generally has an identified cause and follows a Mendelian mode of inheritance, the cause of CHTD remains mostly unknown. CHTD is generally sporadic (98%) and has a high discordance rate (92%) between monozygotic twins. However, first-degree relatives are affected more often than by chance alone (40x) and there is an ethnic and female predominance. We thus hypothesized that CHTD is a disorder caused by two events, one germinal (a necessary but not sufficient predisposing factor) becoming pathogenic only if a second genetic or epigenetic event occurs at the somatic level. Whole exome sequencing (WES) can allow for identification of the genetic cause of CHTD in familial forms, but may also reveal if non-syndromic CHTD (NS-CHTD) cases are enriched in rare protein-altering variant, as seen in congenital heart malformations, a developmental defect that shares several characteristics with CHTD. Moreover, it might also identify new predisposing genes. First, we performed WES on a trio (parent-child) in a family with several siblings affected with severe CH. Second, we compared WES data of a NS-CHTD cohort with data from a control cohort, using a gene-based burden (unbiased) approach and a candidate gene (biased) approach to evaluate whether WES analysis allows to identify new predisposing genes in a well-characterized cohort. Finally, we developed the zebrafish model to test the roles of candidate genes, that will be identified by WES, in thyroid development. We first identified a variant in TSHR that segregated perfectly with the phenotype in the family with CHTD and a mini gene assay showed that this deep intronic variant induced a pseudo-exon, leading to a truncated protein missing the transmembrane domain, thus an inactive TSH receptor. Next, we found that NS-CHTD cases are not enriched in rare protein-altering variants and gene-base burden analysis did not identify novel candidate genes. However, WES data revealed pathogenic or likely pathogenic variants in CH-related genes in 42% of the NS-CHTD cases. Finally, zebrafish is a good model to study thyroid development and our results on IKBKE confirm the importance of vessels in thyroid positioning, but not its role in thyroid migration. First, we showed that WES analysis is a good tool to identify the causative variant in a family with several siblings affected by CH. However, the interpretation of the exome analysis required knowledge of the expression of the relevant isoforms and of the biology of the disease. Second, while a gene-based burden test, using WES data from a well-characterised NS-CHTD cohort, did not identified new predisposing genes, it identified pathogenic or likely pathogenic variants in 42% of the NS-CHTD cases. Whole genome sequencing might be required to identify the genetic causes in NS-CHTD. However, our result may indicate that genetics does not play a major role in thyroid dysgenesis. Finally, we have established that zebrafish is a good model to study thyroid development and may help, in the future, identify pathways implicated in this process.
64

SNPs and Indels Analysis in Human Genome using Computer Simulation and Sequencing Data

Chakrabortty, Sharmistha January 2017 (has links)
No description available.
65

Genetic Landscape of Joubert syndrome in French Canadians

Srour, Myriam 06 1900 (has links)
Le syndrome de Joubert est une maladie récessive caractérisée par une malformation congénitale distincte du tronc cérébral et du cervelet, associée à une anomalie des mouvements oculaires (apraxie oculomotrice), une respiration irrégulière, un retard de développement, et une ataxie à la démarche. Au cours de la dernière décennie, plus de 20 gènes responsables ont été identifiés, tous ayant un rôle important dans la structure et la fonction des cils primaires. Ainsi, le syndrome de Joubert est considéré une ciliopathie. Bien que le Syndrome de Joubert ait été décrit pour la première fois dans une famille canadienne-française en 1969, le(s) gène(s) causal demeurait inconnu dans presque tous les cas de syndrome de Joubert recensés en 2010 dans la population canadienne-française, soit début de mon projet doctoral. Nous avons identifié un total de 43 individus canadiens-français (35 familles) atteints du syndrome de Joubert. Il y avait un regroupement de familles dans la région du Bas-Saint-Laurent de la province de Québec, suggérant la présence d'un effet fondateur. L’objectif de ce projet était de caractériser la génétique du syndrome de Joubert dans la population canadienne-française. Notre hypothèse était qu’il existait un effet fondateur impliquant au moins un nouveau gène JBTS. Ainsi, dans un premier temps, nous avons utilisé une approche de cartographie par homozygotie. Cependant, nous n’avons pas identifié de région d’homozygotie partagée parmi les individus atteints, suggérant la présence d’une hétérogénéité génétique ou allélique. Nous avons donc utilisé le séquençage exomique chez nos patients, ce qui représente une approche plus puissante pour l’étude de conditions génétiquement hétérogènes. Nos travaux ont permis l’identification de deux nouveaux gènes responsables du syndrome de Joubert: C5orf42 et TMEM231. Bien que la localisation cellulaire et la fonction de C5orf42 soient inconnus au moment de cette découverte, nos résultats génétiques combinés avec des études ultérieures ont établi un rôle important de C5orf42 dans la structure et la fonction ciliaire, en particulier dans la zone de transition, qui est une zone de transition entre le cil et le reste de la cellule. TMEM231 avait déjà un rôle établi dans la zone de transition ciliaire et son interaction avec d’autres protéines impliquées dans le syndrome de Joubert était connu. Nos études ont également identifié des variants rares délétères chez un patient JBTS dans le gène ciliaire CEP104. Nous proposons donc CEP104 comme un gène candidat JBTS. Nous avons identifié des mutations causales dans 10 gènes, y compris des mutations dans CC2D2A dans 9 familles et NPHP1 dans 3 familles. Au total, nous avons identifié les mutations causales définitives chez 32 des 35 familles étudiées (91% des cas). Nous avons documenté un effet fondateur complexe dans la population canadienne-française avec de multiples mutations récurrentes dans quatre gènes différents (C5orf42, CC2D2A, TMEM231, NPHP1). Au début de ce projet de recherche, l’étiologie génétique était inconnue chez les 35 familles touchées du syndrome de Joubert. Maintenant, un diagnostique moléculaire définitif est identifié chez 32 familles, et probable chez les 3 autres. Nos travaux ont abouti à la caractérisation génétique du syndrome de Joubert dans la population canadienne-française grâce au séquençage exomique, et révèlent la présence d'un effet fondateur complexe avec une l'hétérogénéité allélique et intralocus importante. Ces découvertes ont éclairé la physiologie de cette maladie. Finalement, l’identification des gènes responsables ouvre de nouvelles perspectives diagnostiques ante-natales, et de conseils génétique, très précieuses pour les familles. / Joubert syndrome (JBTS) is a primarily autosomal recessive disorder characterized by a distinctive mid-hindbrain/cerebellum malformation, eye movement abnormalities (oculomotor apraxia), irregular breathing, developmental delay, and ataxia. Over the past decade, over 20 causal genes have been identified, all of which have an important role in the structure and function of the primary cilia. Thus, JBTS joins an expanding category of diseases termed “ciliopathies”. Though JBTS was first described in affected siblings of a French Canadian (FC) family in 1969, the underlying genesis basis of the disorder was unknown in the overwhelming majority of FC cases at the onset of this doctoral project in 2010. We identified a total of 43 FC individuals with JBTS from 35 families. We observed a clustering of the affected families in the Lower Saint-Lawrence region of the province of Quebec, suggesting the presence of a founder effect. The aim of this doctoral project was to characterize the genetic landscape of JBTS in the FC population, and we hypothesized the presence of a founder effect in novel JBTS gene(s). Therefore, we initially used a homozygosity mapping approach. However, we did not identify any shared regions of homozygosity amongst affected individuals, suggesting the presence of genetic and/or allelic heterogeneity. We therefore primarily used a whole exome sequencing approach in our JBTS patients, a strategy that is better suited for the study of genetically heterogeneous conditions. Our work has resulted in the identification of two novel JBTS genes: C5orf42 and TMEM231. In total, we have identified causal mutations in C5orf42 in 14 families (including the original JBTS family described in 1969), and TMEM231 in 2 families. Though the function and cellular localization of C5orf42 was not known at the time of the publication of our manuscript, our genetic findings combined with subsequent animal and cellular work establish the important role of C5orf42 in ciliary structure and function, particularly at the ciliary transition zone. TMEM231 had been previously shown to localize to the ciliary transition zone and interact with several JBTS gene products. We also identified deleterious rare variants in one JBTS patient in the ciliary gene CEP104, implicating CEP104 as a strong candidate JBTS gene. We identified causal mutations in 10 JBTS genes, including CC2D2A in 9 families and NPHP1 in 3 families. Definite causal mutations were identified in 32 of 35 families (91% of cases). We documented a complex founder effect in the FC population with multiple recurrent mutations in 4 different genes (C5orf42, CC2D2A, TMEM231, NPHP1). Prior to the start of this research endeavor, the underlying genetic etiology of Joubert syndrome was unknown in all 35 families. Now, a definite molecular diagnosis has been identified in 32 families, and a probable molecular diagnosis in the remaining 3. Therefore, our work has resulted in the unraveling of the genetic basis of JBTS in the French-Canadian population using WES, and reveals the presence of a complex founder effect with substantial locus and allelic heterogeneity.
66

Bases génétiques de la dysplasie fibromusculaire : une approche d’étude d’exome et de génétique épidémiologique / Understanding the genetic basis of fibromuscular dysplasia using approaches of whole exome sequencing and genetic epidemiology

Kiando, Soto Romuald 08 July 2016 (has links)
La dysplasie fibromusculaire artérielle (DFM) est un groupe de pathologies vasculaires non inflammatoires, et non athéromateuses de la paroi artérielle. Elle est caractérisée par la sténose, l'occlusion, l’anévrisme ou la dissection des artères de petit et moyen calibres, en particulier les artères rénales et le tronc supra-aortique. La DFM est un facteur de risque de l’hypertension et de l’accident vasculaire cérébral. Elle touche essentiellement les femmes (80% des cas) de moins de 50 ans. La prévalence en population générale est inconnue et les estimations varient de 0.4% pour les formes cliniques à 4% dans une cohorte de donneurs de reins. Une agrégation familiale a été démontrée et une composante génétique suggérée. L'objectif de mon travail de thèse était de caractériser les bases génétiques la DFM. Dans la première partie, nous avons analysé des variants génétiques rares générés par séquençage d'exomes chez 16 cas apparentés de DFM issus de 7 fratries. Aucun gène majeur n’était muté pour l’ensemble des fratries ou pour au moins 3 fratries sur 7. Cependant, nous avons pu mettre en évidence puis validé un enrichissement en variants rares à fort potentiel fonctionnel de quatre gènes candidats pour la DFM (MYLK, OBSCN, DYNC2H1, RNF213) en combinant l’approche de séquençage d’exomes et l’étude d’association gène entier de 62767 variants rares (MAF < 5%) générés par génotypage avec la puce Exome-chip chez 249 cas non apparentés de DFM et 689 témoins. Cependant, l’implication de ces gènes dans la DFM doit être confirmée dans d’autres familles, et par des études de validations fonctionnelles. Dans la seconde partie, nous avons étudié l'association avec la DFM de 25606 variants fréquents (MAF ≥ 5%) de l’Exome-chip. Les résultats majeurs obtenus ont été répliqués dans une première étude (402 cas de DFM et 2537 témoins) puis dans 3 autres études incluant 512 cas de DFM et 669 témoins. La méta-analyse de l’ensemble a permis d’associer à la DFM le polymorphisme rs9349379-A situé dans l’intron du gène PHACTR1 (OR=1,39 [1,39-1,54] ; P=7,36 ×10-10). Ce variant est aussi un facteur de risque pour la maladie coronaire, la migraine et la dissection de l’artère cervicale. Des études complémentaires conduites chez 2458 volontaires non malades ont permis de montrer que l’allèle à risque pour la DFM, rs9349379-A est associé avec une augmentation de l’épaisseur intima média (P=1,97×10-4) et du rapport de la paroi sur la lumière artérielle (P=0,002), deux paramètres décrits comme augmentés chez les cas de DFM dans des études antérieures. Ensuite, PHACTR1 a été détecté par immunohistochimie dans l’endothélium et les cellules musculaires lisses de carotides dysplasiques et non dysplasiques avec une expression augmentée de PHACTR1 pour les porteurs de l’allèle à risque de DFM dans des cultures primaires de fibroblastes humains (N=86, P=0,003). Enfin, l’invalidation de Phactr1 chez le poisson zèbre conduit à une dilatation des vaisseaux indiquant un défaut du développement vasculaire. Ce travail confirme le caractère multifactoriel et hétérogène de la DFM et ouvre de nouvelles perspectives pour évaluer l’ensemble de la variabilité génomique des patients de DFM par des approches massives de génétique épidémiologique. / Fibromuscular dysplasia (FMD) is a group of nonatherosclerotic and noninflammatory vascular diseases leading to stenosis, aneurysm, dissection and/or occlusion of medium-sized arteries, in particular the renal and extracranial cervical arteries. Clinical manifestations of FMD are hypertension, dizziness, pulsatile tinnitus, transient ischemic attack or stroke, according to the involved arterial beds. FMD occurs predominantly (80% of cases) in females under 50 years with a variable prevalence estimation from 0.4% for asymptomatic clinical relevant forms to 4% in potential renal donors. The pathogenesis of FMD is unknown and a genetic origin is suspected given its demonstrated familial aggregation. The aim of my thesis work was to characterize genetic basis of FMD. In the first part of this thesis, we analyzed whole exome sequencing data in 16 related FMD cases from seven families. No gene harbors variants that were shared by all affected members in at least three out seven families. Using combined strategy of whole exome sequencing and gene based association study of 62,767 rare variants (MAF < 5%) generated by Exome‐chip arrays in 249 unrelated FMD cases and 689 controls, we have identified and validated an enrichment of rare and putatively functional variants in four candidates genes (MYLK, OBSCN, DYNC2H1 and RNF213). This results need to be validated in other FMD families and by functional analysis. In the second part, we analyzed 25,606 common variants (MAF ≥ 5%) generated by Exome‐chip array. Top loci were replicated in first replication study (402 cases and 2,537 controls) and in 3 others studies (512 cases and 669 controls). Meta-analysis of all including 1,154 unrelated FMD cases and 3,895 controls allowed identification of association between FMD and rs9349379-A (OR=1.39 [1.39-1.54]; P=7.4×10‐10). rs9349379 is intronic to PHACTR1, a risk locus for coronary artery disease, migraine, and cervical artery dissection. The analyses of geometrical parameters of carotids from 2,458 healthy volunteers indicated higher intima media thickness (P = 1.97×10‐4) and wall to lumen ratio (P = 0.002) in rs9349379‐A carriers, suggesting indices of carotid hypertrophy as previously described in carotids of FMD patients. Immunohistochemistry detected PHACTR1 in endothelium and smooth muscle cells of FMD and normal human carotids. The expression of PHACTR1 by genotypes in primary human fibroblasts showed higher expression in rs9349379‐A carriers (N=86, P=0.003). Phactr1 knockdown in zebrafish resulted in dilated vessels indicating subtle impairment of vascular development. This work confirms the multifactorial and heterogeneous genetic architecture of the FMD and opens new opportunities to evaluate all of genomic variability of FMD patients with massive genetic epidemiology approaches.
67

Etude des mécanismes de rupture de tolérance lymphocytaire au cours des déficits immunitaires primitifs de l'adulte avec manifesations auto-immunes / Study of lymphocyte tolerance breakdown in adults primary immunodeficiencies with autoimmunity

Guffroy, Aurélien 01 April 2019 (has links)
L’association entre déficits immunitaires primitifs (DIPs) et manifestations auto-immunes peut sembler paradoxale lorsque l’on aborde les DIPs comme des défauts d’immunité opposés à l’autoimmunité vue comme excès d’immunité adaptative à l’encontre du soi. Néanmoins, loin de se résumer à un simple défaut d’une ou plusieurs composantes du système immunitaire qui prédispose aux infections par divers agents pathogènes, les DIPs sont fréquemment associés à une autoimmunité; parfois révélatrice. Ainsi, les données épidémiologiques issues de registres ou de larges séries de patients atteints de DIPs s’accordent sur une prévalence globale de 25 à 30% de complications auto-immunes (au premier rang desquelles figurent les cytopénies auto-immunes). Différentes hypothèses sont avancées pour rendre compte de l’auto-immunité dans les DIPs. On peut citer : 1°) une perturbation profonde de l’homéostasie lymphocytaire, en particulier dans les déficits immunitaires combinés sévères (CID) avec lymphopénies T et B ; 2°) des défauts intrinsèques des lymphocytes B permettant une rupture de tolérance précoce des LB auto réactifs ; 3°) un comportement aberrant des LT (défaut de maturation, excès d’activation) ; 4°) une absence de lymphocytes T ou de B régulateurs ; 5°) une production inappropriée de certaines cytokines proinflammatoires comme dans les interféronopathies. Ces hypothèses concernent surtout les DIPs pédiatriques sévères. Mon travail de thèse explore la rupture de tolérance immunitaire adaptative au cours des DIPs de l’adulte par différentes approches. Nous nous sommes en particulier attachés au plus fréquent, le DICV (Déficit Immunitaire Commun Variable), déficit immunitaire humoral pas toujours bien défini sur le plan génétique et physiopathologique qui constitue un défi thérapeutique lorsqu’il est compliqué d’une auto-immunité nécessitant un traitement immunosuppresseur. / The association between primary immune deficiency (PID) and autoimmunity may seem paradoxical when PID is considered only as an immune response defect against pathogens and autoimmunity only as an excess of immunity. Nevertheless, far from being simple immune defects increasing the risk of infections, DIPs are frequently associated with autoimmunity. Even more, autoimmunes manifestations can sometimes reveal a PID. Thus, epidemiological data from registers or large series of patients with PIDs agree on an overall prevalence of 25 to 30% of autoimmune complications (with auto-immune cytopenias as first causes). Several hypotheses have been proposed with different underlying mechanisms to explain the tolerance breakdown in PIDs. We can cite : 1°) a severe disturbance of lymphocyte homeostasis, for example in severe combined immunodeficiencies ; 2°) an impaired B-cell developpement with earlystage defects of tolerance ; 3°) a dysregulation of T cells (developpement or activation impairments) ; 4°) a dysfunction of T-reg (or B-reg) ; 5°) an excess of production of proinflammatory cytokines. These hypotheses are especially true for early-onset PIDs (in infancy). In this work (PhD), we explore the mechanisms of tolerance breakdown involved in adults PIDs. We use several approaches to describe the pathways leading to autoimmunity, focusing on the most common PID in adult : CVID (common variable immunodeficiency). This syndrome is not well defined on the genetic and physiopathological level. It is still a therapeutic challenge when complicated by autoimmunity (requiring immunosuppressive therapy).
68

La découverte de l’origine génétique de l’asplénie congénitale isolée chez l’homme / The Genetic Dissection of Isolated Congenital Asplenia in Humans

Bolze, Alexandre 06 November 2012 (has links)
L’asplénie ou l’absence de la rate peut être congénitale, c’est- à -dire absente dès la naissance, ou bien acquise, par exemple lors d’une opération après un accident. L’asplénie congénitale est le plus souvent associée à d’autres problèmes développementaux. En particulier l’asplénie congénitale est associée à des problèmes de développement du cœur, dans le cadre des syndromes d’hétérotaxie. Ces syndromes d’hétérotaxie sont caractérisés par des problèmes de latéralité droite-gauche. Ainsi une personne ayant deux parties ‘droites’ n’aura pas de rate. A contrario, l’asplénie congénitale isolée est caractérisée par l’absence de rate et aucune autre malformation. L’asplénie congénitale isolée est une maladie très rare. Nous avons estimé la fréquence de la maladie à un cas pour un million de naissances. C’est aussi une maladie extrêmement mortelle. La grande majorité des patients ayant une asplénie congénitale isolée souffrent d’infections bactériennes sévères lors de l’enfance et la moitie des cas reportés sont décédés dus à une infection bactérienne, le plus souvent du à une infection par Streptococcus pneumoniae. Malgré la sévérité de cette maladie, celle-ci reste très peu connue et très peu étudiée. Ainsi le diagnostique est souvent trop tardif. Parmi les quelques dizaines de cas décrits dans la littérature, la moitié sont des cas familiaux avec plusieurs membres de la même famille affectée. Le mode de transmission semble être autosomique dominant dans la majorité des cas. En outre aucune preuve n’existe concernant un facteur environnemental pour cette maladie. Enfin des travaux récents ont montrés que l’absence de pancréas chez l’homme était une maladie génétique, et due à des mutations dans le gène GATA6 chez la moitié des patients. L’objectif de cette thèse est donc de déterminer l’origine génétique de l’asplénie congénitale isolée chez l’homme. J’ai fait l’hypothèse que l’asplénie congénitale isolée chez l’homme est due à des mutations mendéliennes dans un gène important pour le développement de la rate. Afin de tester notre hypothèse nous avons recruté des patients à travers des collaborations avec des médecins étrangers ainsi qu’un partenariat avec toutes les unités pédiatriques de France. Nous avons finalement pu recruter 37 patients appartenant à 24 familles différentes. La littérature sur le développement de la rate chez la souris et encore plus sur l’homme étant minimale, il était difficile d’identifier de bons gènes candidats pour être responsables de l’asplénie. Nous avons donc opté pour une stratégie portant sur le génome entier, sans biais lier a la littérature. La stratégie était d’utiliser le séquençage de l’exome de tous les patients. Le séquençage de l’exome est en fait le séquençage de tous les exons du génome, ou au moins 90% des exons du génome. La technique du séquençage de l’exome est arrivée à la fin de l’année 2009 et nous avons été un des premiers laboratoires à l’utiliser. Il fallait donc que nous l’essayons en premier sur un cas facile afin de vérifier que cette technique fonctionnait. Nous avons donc fait une étude préliminaire sur un cas ‘facile’. Par cas facile, il faut comprendre un cas où la probabilité que ce soit une mutation mendélienne dans un gène qui soit responsable de la maladie soit la plus forte possible, et où le nombre de gènes à regarder soit le plus faible possible. Un cas ‘facile’ est donc le cas d’une famille avec de nombreux patients, et de surcroit une famille consanguine. Dans le cas d’une famille consanguine la probabilité que ce soit une mutation récessive qui soit responsable de la maladie génétique est très importante. On peut alors se restreindre à analyser les régions du génome ou toutes les variations sont homozygotes. Nous avions une famille dans ce cas. Il y avait 4 patients dans cette famille souffrant d’infections bactériennes sévères dues à une asplenie fonctionnelle, ainsi que d’infections virales / Isolated congenital asplenia (ICA) is a rare primary immunodeficiency, first described in 1956, thattypically manifests in childhood with sudden, life-threatening, invasive bacterial disease. Patients withICA do not display any other overt developmental anomalies. The genetic etiology of ICA has remainedelusive. I hypothesized that ICA results from single-gene inborn errors of spleen development. I aimedto decipher the molecular genetic basis of ICA by pursuing a genome-wide approach, based on thesequencing of the whole-exome and the detection of copy number variations in all patients of ourcohort. I found that heterozygous mutations in RPSA, ribosomal protein SA, were present in more thanhalf of ICA patients (19/33). I then showed that haploinsufficiency of RPSA led to ICA in one kindredat least. RPSA is a protein involved in pre-rRNA processing and is an integral part of the ribosome. Thechallenge is, now, to understand the pathogenesis of the disease. How does a mutation in a ubiquitousand highly expressed gene lead to a spleen specific phenotype? This discovery will set the basis for abroader understanding of the development of the spleen in humans and the function of a ribosomalprotein. This discovery will also be beneficial to the families of patients with ICA, guiding geneticcounseling. It will lead to prevention of infections in newborns with mutations in RPSA. Finally themethod we used to analyze the exomes of the ICA cohort will be useful to discover the genetic etiologyof other genetic diseases.
69

Using whole-exome sequencing data in an exome-wide association study approach to identify genetic risk factors influencing acute lymphoblastic leukemia response : a focus on asparaginase complications & vincristine-induced peripheral neuropathy

Abaji, Rachid 12 1900 (has links)
Le traitement de la leucémie lymphoblastique aiguë (LLA) de l’enfant, une affection d'origine maligne des cellules progénitrices lymphoïdes, s’est considérablement amélioré au cours des dernières décennies. En effet, le taux de succès du traitement a dépassé 90% dans des conditions favorables. Cependant, des toxicités liées au traitement peuvent être fatales et entrainer l’interruption ou la cessation du traitement. L'allergie, la pancréatite et la thrombose sont des complications fréquentes du traitement de la LLA et sont associées à l'utilisation de l'asparaginase (ASNase), tandis qu’une toxicité fréquente due à la vincristine (VCR) induit la neuropathie périphérique (VIPN). Étant donné que l’ajustement du schéma posologique afin d’augmenter l'efficacité et diminuer la toxicité est un processus sensible, ceci demeure un défi majeur dans plusieurs protocoles de traitement. La pharmacogénétique étudie comment des altérations de la composante génétique peuvent influer sur la variabilité interindividuelle observée dans la réponse au traitement. Une meilleure compréhension de la base moléculaire de cette variabilité pourrait améliorer considérablement les résultats du traitement, en permettant la personnalisation de ce dernier en fonction du profil génétique du patient. Des études récentes suggèrent l’avantage d’appliquer l’analyse de l’exome à la découverte de variants associés à des traits humains complexes ainsi qu’à des phénotypes de réactions médicamenteuses. L'objectif de notre travail était d'utiliser les données de séquençage pour réaliser des études d'association à l'échelle de l'exome, y compris des étapes de filtrage et de validation, afin d'identifier de nouveaux variants génétiques susceptibles de moduler le risque de développer des complications associées à ASNase et à VIPN. Douze SNP étaient associés à des complications due à l’ASNase dans la cohorte initiale, dont 3 étaient associés à une allergie, 3 à une pancréatite et 6 à une thrombose. Parmi ceux-ci, les variants rs3809849, rs11556218 et rs34708521 des gènes MYBBP1A, IL16 et SPEF2 respectivement ont été associés à des complications multiples et leur association à une pancréatite a été répliquée dans une cohorte de validation indépendante. En ce qui concerne la VCR, trois variantes ont été associées à la modulation du risque de VIPN: rs2781377 dans SYNE2, rs10513762 dans MRPL47 et rs3803357 dans BAHD1. Nous démontrons également le puissant effet combiné de la présence de plusieurs variants de risque pour chacune des toxicités étudiées et fournissons des modèles de prédiction du risque pour la pancréatite et le VIPN basés sur la méthode d’évaluation du risque génétique pondérée et qui ont été validés à l’interne. De plus, étant donné une association du polymorphisme du gène MYBBP1A avec de multiples issus de traitement, nous avons cherché à comprendre comment cette altération génétique se traduit par des variabilités de réponse aux traitements à l’ASNase. En utilisant la technique CRISPR-CAS9 pour induire l'inactivation de gènes dans des lignées cellulaires cancéreuses PANC1 (pancréatiques) nous avons testé la différence de viabilité entre les cellules inactivées et les cellules du type sauvage à la suite de la suppression du gène et du traitement par ASNase. Nos résultats suggèrent un rôle fonctionnel de ce gène dans la modulation de la viabilité, de la capacité de prolifération et de la morphologie des cellules knock-out, ainsi que dans leur sensibilité à l'ASNase, et plaident en outre pour que le gène influence l’issus du traitement de la LLA par ASNase. Le présent travail démontre que l’utilisation de l’approche de séquençage de l’exome entier dans le contexte d’une étude d’association à l’échelle de l’exome est une stratégie valide « sans hypothèse » pour identifier de nouveaux marqueurs génétiques modulant l’effet du traitement de la LLA de l’enfant, et souligne l’importance de l'effet synergique de la combinaison des locus à risque. / Treatment of childhood acute lymphoblastic leukemia (ALL), a malignant disorder of lymphoid progenitor cells has improved significantly over the past decades and treatment success rates have surpassed 90% in favorable settings. However, treatment-related toxicities can be life-threatening and cause treatment interruption or cessation. Allergy, pancreatitis and thrombosis are common complications of ALL treatment associated with the use of asparaginase (ASNase), while vincristine-induced peripheral neuropathy (VIPN) is a frequent toxicity of vincristine (VCR). It is a sensitive process and a constant struggle to adjust the dosing regimen to ensure maximum efficacy and minimum toxicity. Pharmacogenetics studies show alterations in the genetic component between individuals can influence the observed variability in treatment response. A better understanding of the molecular basis of this variability in drug effect could significantly improve treatment outcome by allowing the personalization of ALL treatment based on the genetic profile of the patient. Emerging reports suggest the benefit of applying exome analysis to uncover variants associated with complex human traits as well as drug response phenotypes. Our objective in this work was to use available whole-exome sequencing data to perform exome-wide association studies followed by stepwise filtering and validation processes to identify novel variants with a potential to modulate the risk of developing ASNase complications and VIPN. Twelve SNPs were associated with ASNase complications in the discovery cohort including 3 associated with allergy, 3 with pancreatitis and 6 with thrombosis. Of those, rs3809849 in MYBBP1A, rs11556218 in IL16 and rs34708521 in SPEF2 genes were associated with multiple complications and their association with pancreatitis was replicated in an independent validation cohort. As for VCR, three variants were associated with modulating the risk of VIPN: rs2781377 in SYNE2, rs10513762 in MRPL47 and rs3803357 in BAHD1. We also demonstrate a strong combined effect of harbouring multiple risk variants for each of the studied toxicities, and provide internally-validated risk-prediction models based on the weighted genetic risk score method for pancreatitis and VIPN. Furthermore, given the association of the polymorphism in MYBBP1A gene with multiple treatment outcomes, we aimed at understanding how this genetic alteration translates into differences in ASNase treatment response through cell-based functional analysis. Using CRISPR-CAS9 technology we produced gene knockout of PANC1 (pancreatic) cancer cell-lines and tested the difference in viability between the knockouts and wild-type cells following gene deletion and ASNase treatment. Our results suggest a functional role of this gene in modulating the viability, proliferation capacity and the morphology of the knockout cells as well as their sensitivity to ASNase and further advocates the implication of the gene in influencing the outcome of ALL treatment with ASNase. The present work demonstrates that using whole-exome sequencing data in the context of exome-wide association study is a successful “hypothesis-free” strategy for identifying novel genetic markers modulating the effect of childhood ALL treatment and highlights the importance of the synergistic effect of combining risk loci.
70

Prioritizing Causative Genomic Variants by Integrating Molecular and Functional Annotations from Multiple Biomedical Ontologies

Althagafi, Azza Th. 20 July 2023 (has links)
Whole-exome and genome sequencing are widely used to diagnose individual patients. However, despite its success, this approach leaves many patients undiagnosed. This could be due to the need to discover more disease genes and variants or because disease phenotypes are novel and arise from a combination of variants of multiple known genes related to the disease. Recent rapid increases in available genomic, biomedical, and phenotypic data enable computational analyses, reducing the search space for disease-causing genes or variants and facilitating the prediction of causal variants. Therefore, artificial intelligence, data mining, machine learning, and deep learning are essential tools that have been used to identify biological interactions, including protein-protein interactions, gene-disease predictions, and variant--disease associations. Predicting these biological associations is a critical step in diagnosing patients with rare or complex diseases. In recent years, computational methods have emerged to improve gene-disease prioritization by incorporating phenotype information. These methods evaluate a patient's phenotype against a database of gene-phenotype associations to identify the closest match. However, inadequate knowledge of phenotypes linked with specific genes in humans and model organisms limits the effectiveness of the prediction. Information about gene product functions and anatomical locations of gene expression is accessible for many genes and can be associated with phenotypes through ontologies and machine-learning models. Incorporating this information can enhance gene-disease prioritization methods and more accurately identify potential disease-causing genes. This dissertation aims to address key limitations in gene-disease prediction and variant prioritization by developing computational methods that systematically relate human phenotypes that arise as a consequence of the loss or change of gene function to gene functions and anatomical and cellular locations of activity. To achieve this objective, this work focuses on crucial problems in the causative variant prioritization pipeline and presents novel computational methods that significantly improve prediction performance by leveraging large background knowledge data and integrating multiple techniques. Therefore, this dissertation presents novel approaches that utilize graph-based machine-learning techniques to leverage biomedical ontologies and linked biological data as background knowledge graphs. The methods employ representation learning with knowledge graphs and introduce generic models that address computational problems in gene-disease associations and variant prioritization. I demonstrate that my approach is capable of compensating for incomplete information in public databases and efficiently integrating with other biomedical data for similar prediction tasks. Moreover, my methods outperform other relevant approaches that rely on manually crafted features and laborious pre-processing. I systematically evaluate our methods and illustrate their potential applications for data analytics in biomedicine. Finally, I demonstrate how our prediction tools can be used in the clinic to assist geneticists in decision-making. In summary, this dissertation contributes to the development of more effective methods for predicting disease-causing variants and advancing precision medicine.

Page generated in 0.039 seconds