• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 5
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 12
  • 12
  • 5
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Computational modeling for identification of low-frequency single nucleotide variants

Hao, Yangyang 16 November 2015 (has links)
Indiana University-Purdue University Indianapolis (IUPUI) / Reliable detection of low-frequency single nucleotide variants (SNVs) carries great significance in many applications. In cancer genetics, the frequencies of somatic variants from tumor biopsies tend to be low due to contamination with normal tissue and tumor heterogeneity. Circulating tumor DNA monitoring also faces the challenge of detecting low-frequency variants due to the small percentage of tumor DNA in blood. Moreover, in population genetics, although pooled sequencing is cost-effective compared with individual sequencing, pooling dilutes the signals of variants from any individual. Detection of low frequency variants is difficult and can be cofounded by multiple sources of errors, especially next-generation sequencing artifacts. Existing methods are limited in sensitivity and mainly focus on frequencies around 5%; most fail to consider differential, context-specific sequencing artifacts. To face this challenge, we developed a computational and experimental framework, RareVar, to reliably identify low-frequency SNVs from high-throughput sequencing data. For optimized performance, RareVar utilized a supervised learning framework to model artifacts originated from different components of a specific sequencing pipeline. This is enabled by a customized, comprehensive benchmark data enriched with known low-frequency SNVs from the sequencing pipeline of interest. Genomic-context-specific sequencing error model was trained on the benchmark data to characterize the systematic sequencing artifacts, to derive the position-specific detection limit for sensitive low-frequency SNV detection. Further, a machine-learning algorithm utilized sequencing quality features to refine SNV candidates for higher specificity. RareVar outperformed existing approaches, especially at 0.5% to 5% frequency. We further explored the influence of statistical modeling on position specific error modeling and showed zero-inflated negative binomial as the best-performed statistical distribution. When replicating analyses on an Illumina MiSeq benchmark dataset, our method seamlessly adapted to technologies with different biochemistries. RareVar enables sensitive detection of low-frequency SNVs across different sequencing platforms and will facilitate research and clinical applications such as pooled sequencing, cancer early detection, prognostic assessment, metastatic monitoring, and relapses or acquired resistance identification.
12

Paysage génomique de la leucémie aiguë lymphoblastique de l’enfant

Spinella, Jean-François 11 1900 (has links)
La leucémie aiguë lymphoblastique (LAL) est une maladie complexe à l’étiologie multifactorielle. Elle représente la forme la plus commune de cancer pédiatrique et malgré une augmentation significative du taux de survie des patients, près de 15% d’entre eux ne répondent pas aux traitements classiques et plus de 2/3 subissent les effets du traitement à long terme. Réduire ces chiffres passe par une meilleure compréhension des causes sous-jacentes de la LAL. À travers l’analyse des données de séquençage de nouvelle génération (SNG) de la cohorte QcALL du CHU Sainte-Justine, je me suis intéressé aux déterminants génomiques contribuant aux différents aspects de la LAL (prédispositions, développement/progression et rechutes). Dans un premier temps, j’ai développé un outil d’analyse (SNooPer) basé sur un algorithme d’apprentissage intégrant les données SNG normales et tumorales des patients, permettant d’identifier les mutations somatiques au sein de données à faible couverture (low-pass). Cet outil, couplé aux analyses prédictives in silico et aux validations fonctionnelles adéquates, nous a permis de caractériser les événements rares ou récurrents impliqués dans le processus leucémogène. En analysant les données de LALs pré-B, j’ai pu mettre en évidence une série de mutations drivers rares au niveau de gènes (ACD, DOT1L, HCFC1) qui n’avaient jamais été associés à la LAL. L’étude fonctionnelle de la mutation identifiée au niveau d’ACD, membre du complexe shelterin, a démontré qu’elle conduit à une réduction de l’apoptose et une augmentation de la taille des télomères. Outre l’intérêt de la découverte de ces nouveaux drivers, je souhaitais démontrer l’importance des mutations somatiques rares afin d'établir la spécificité interindividuelle, généralement sous-estimée, et d’identifier l’ensemble des fonctions cellulaires impliquées. Au cours de ces travaux, j'ai également mis en évidence de nouveaux évènements récurrents de la LAL à cellules T (LAL-T), en particulier au niveau de patients présentant un phénotype immature encore mal caractérisé. J'ai démontré l’influence d'une mutation dans le gène codant pour U2AF1, membre de la machinerie d’épissage (spliceosome), sur l’épissage de gènes d’intérêt et ainsi confirmer l’importance du dysfonctionnement de l’épissage dans le développement de la leucémie. J'ai également identifié deux suppresseurs de tumeurs portés par le chromosome X, MED12 et USP9X, qui n’avaient jamais été associés à la LAL-T auparavant et qui représentent un intérêt particulier étant donné le débalancement de l'incidence en fonction du sexe (ratio garçon:fille =1.22). Enfin, grâce à l’étude longitudinale de patients LAL-B ayant subi une ou plusieurs rechutes, j'ai analysé l'architecture et l'évolution clonales des tumeurs. J’ai ainsi identifié 2 profils évolutifs distincts gouvernant les rechutes précoces et tardives: d'un côté, une dynamique élevée alimentée par un dysfonctionnement des mécanismes de réparation de l'ADN et conduisant à l'émergence rapide de clones mieux adaptés – de l'autre, une dynamique réduite, quasi-inerte, suggérant l'échappement de cellules en dormance épargnée par la chimiothérapie. De manière générale, cette thèse a permis de contribuer à la caractérisation des déterminants génomiques qui constituent la variabilité inter- et intra-tumorale, participent au processus leucémogène et/ou aux mécanismes de résistance au traitement. Ces nouvelles connaissances contribueront à un raffinement de la stratification des patients et leur prise en charge personnalisée. / Acute lymphoblastic leukemia (ALL) is a complex disease with a multi-factorial etiology. It represents the most frequent pediatric cancer and despite a significant increase of survival rate, about 15% of the patients still do not respond to current treatment protocols and over 2/3 of survivors experience long-term treatment related side effects. To reduce these numbers, a better understanding of the underlying causes of ALL is needed. Through the analysis of next-generation sequencing (NGS) data obtained from the established Quebec cALL (QcALL) cohort of the Sainte-Justine hospital, I have been particularly concerned about the genomic determinants that contribute to different phases of ALL (predispositions, onset/progress and relapses). First, I developed an analysis tool (SNooPer) based on a machine learning algorithm integrating both normal and tumor NGS data of the patient to identify somatic mutations from low-pass sequencing. This tool, combined to in silico predictive analysis and to adequate functional validations, allowed us to characterize rare or recurrent events involved in the leukemogenesis process. Through the analysis of pre-B ALLs, I have been able to identify several rare driver genes which had never been associated to ALL before (ACD, DOT1L, HCFC1). The functional study of the identified mutation in ACD, a member of the shelterin complex, showed a concomitant lengthening of the telomeres and decreased apoptosis levels in leukemia cells. Besides the interest aroused by the discovery of these new drivers, I wanted to demonstrate the importance of low-frequency somatic events to establish the generally underestimated interindividual specificity and identify all cellular functions involved. During this work, I also identified new recurrent driver events in T-cell ALL (T-ALL), particularly among poorly characterized immature T-ALL patients. For example, I demonstrated the impact of a recurrent mutation in U2AF1, member of the spliceosome, on alternative splicing of cancer-relevant genes, further suggesting the importance of aberrant splicing in leukemogenesis. I also identified two new X-linked tumor suppressors, MED12 and USP9X, never associated to T-ALL before and obtained results supporting a potential role for these genes in the male-biased sex ratio observed in T-ALL (ratio male:female =1.22). Finally, through the longitudinal study of pre-B cALLs who suffered one or multiple relapses, I analyzed the clonal architecture and evolution of the tumors. I identified two distinct evolution patterns governing either early or late relapses: on one hand a highly dynamic pattern, sustained by a defect of DNA repair processes, illustrating the quick emergence of fitter clones - and on the other hand, a quasi-inert evolution pattern suggesting the escape from dormancy of neoplastic stem cells likely spared from initial cytoreductive therapy. Overall, this thesis contributed to the characterization of genomic determinants that constitute the inter- and intra-tumor variability, participate in leukemogenesis and/or in resistance mechanisms. This new knowledge will contribute to refine patient stratification and treatment.

Page generated in 0.0914 seconds