Return to search

The application of next-generation sequencing technologies: from Mendelian diseases to cancer

The field of medical informatics has been primarily driven by advances in technology. In recent years, “next-generation sequencing” (NGS) has emerged as an affordable and quick means for accurate, large-scale sequencing at a single-base resolution, generating many gigabases of data per sequencing run. As with all new technological innovations, considerable development and improvements of analysis software is required, specifically to accurately extract relevant information from these large datasets. In this thesis, we explore two applications of next-generation sequencing to human health: sequencing of all protein coding exons (i.e. exome sequencing) of patients with Fowler Syndrome, a rare, prenatally lethal Mendelian disease, and sequencing of mRNA (i.e. RNA-Seq) of breast cancer cell lines and tumors from BRCA1 germline mutation carriers. We focus on both the bioinformatics developments and the application to human health in a “simple” Mendelian disease and in a genetically complex cancer. Indeed, in both these studies, we aim to find genetic events which may improve patient care. The discovery of the gene causing Fowler Syndrome will lead to improved genetic counseling for affected families and may influence choices such as family planning or preventive measures (e.g. prenatal or preimplantation genetic diagnosis). Delineation of transcripts which unambiguously characterize or contribute to BRCA1-related breast cancers could lead to new biomarkers or therapeutic options. In the first study, we develop a bioinformatics pipeline capable of identifying Mendelian disease genes from exome sequencing data. These diseases are typically caused by a single mutation which affects the protein coding sequence; thus, exome sequencing can be used to detect all coding variants in an individual which are then filtered to identify the most likely causative mutation. The successful application of this pipeline is demonstrated in Fowler Syndrome. We found that mutations in the gene FLVCR2 are responsible for this recessive disease using only two affected individuals. Next, we use mRNA sequencing to identify alternative splice isoforms which may contribute to tumorigenesis in breast cancers caused by BRCA1 germline mutations. This subtype of breast cancer accounts for a large proportion of familial breast cancers and is associated with a poorer than expected prognosis. These breast cancers are characterized by several dysregulated cellular processes but the role of alternative splicing in tumorigenesis has not been investigated in BRCA1-related breast cancers. We find several highly recurrent splice junctions that are more abundant in BRCA1-related breast cancers than in controls but none which clearly contribute to breast cancer tumorigenesis. This study illustrates the heterogeneity of BRCA1-related breast cancers at the level of RNA splicing. In summary, in this thesis we show that NGS is an effective tool for global identification and analysis of genetic events in an individual and will thus enable the transition to personalized-medicine. / Le domaine d'informatique médicale avance primordialement grâce aux développements technologiques. Durant les années récentes, le « séquençage de nouvelle-génération » (SNG) a émergé comme un moyen abordable et rapide pour le séquençage à grande échelle. Cette technologie possède une grande précision, avec une résolution au niveau d'une seule base d'ADN, générant plusieurs gigabases d'information. Comme toutes innovations technologiques, des développements et améliorations des logiciels analytiques sont essentiels, en particulier pour extraire avec précision les informations pertinentes à partir de ces grands ensembles de données. Dans cette thèse, nous explorons deux applications de SNG à la santé humaine: le séquençage de tous les exons codant les protéines (i.e. séquençage d'exome) des patients avec le Syndrome Fowler, une maladie Mendélienne rare et létale, et le séquençage des ARNm (i.e. ARN-Seq) des lignées cellulaires et tumeurs des patients du cancer de sein portant une mutation germinale de BRCA1. Nous nous concentrons sur les développements bioinformatiques et les applications pour la santé humaine dans une maladie Mendélienne « simple » et dans un cancer génétiquement complexe. En effet, dans les deux études, nous essayons de trouver des événements génétiques qui pourraient améliorer le soin des patients. La découverte du gène qui cause le Syndrome Fowler rendra les conseils génétiques plus complets pour les familles atteintes par cette maladie et pourrait influencer les choix de planification familiale ou de mesure préventive (par exemple, le diagnostic génétique prénatal ou préimplantatoire). La découverte des isoformes qui caractérisent ou contribuent sans ambigüité au cancer de sein relié à BRCA1 pourrait mener à des nouveaux biomarqueurs et traitements. Dans la première étude, nous développons une approche bioinformatique capable d'identifier les gènes causant les maladies Mendéliennes à partir des données du séquençage d'exome. Ces maladies sont généralement causées par une seule mutation qui change la séquence des protéines; ainsi, le séquençage d'exome peut être utilisé pour identifier toutes les variations dans l'exome d'un individu qui sont ensuite filtrées pour trouver la mutation causative la plus probable. Nous démontrons notre succès avec l'application de cette approche dans le Syndrome Fowler. Nous avons trouvé que des mutations dans le gène FLVCR2 causent cette maladie récessive, en utilisant seulement deux individus. Ensuite, nous utilisons le séquençage des ARNm pour identifier des isoformes alternatifs qui pourraient contribuer à la tumorigenèse dans les cancers de sein causé par des mutations de BRCA1. Ce type de cancer de sein représente une grande proportion des cancers de sein familiale et est associé avec une prognose moins favorable. Ces cancers de sein sont caractérisés par des processus cellulaires dérégulés; pourtant, le rôle de l'épissage alternatif dans la tumorigène n'a jamais été exploré dans les cancers de sein relié à BRCA1. Nous trouvons plusieurs jonctions d'épissages très récurrents qui sont plus abondantes dans les cancers de sein relié à BRCA1, par rapport aux autres cancers de sein, mais aucune contribuant clairement à la tumorigène du cancer de sein. Cette étude démontre le hétérogénéité des cancers de relié à BRCA1au niveau de l'épissage alternatif. En bref, dans cette thèse nous montrons que le SNG est un outil effectif pour l'identification et l'analyse globale des événements génétiques dans un individu, permettant ainsi la transition vers la médicine personnalisée.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.104572
Date January 2011
CreatorsLalonde, Emilie
ContributorsJacek Majewski (Supervisor1), William Foulkes (Supervisor2)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (Department of Human Genetics)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0032 seconds