Global ETD Search

161	Régulation du site d'expression du VSG chez Trypanosoma brucei Amiguet Vercher, Amélia January 2005 (has links) Doctorat en Sciences / info:eu-repo/semantics/nonPublished Sciences exactes et naturelles Trypanosoma brucei RNA Trypanosoma brucei ARN
162	Characterization of the shuttling properties of RNA-binding TIA proteins Zhang, Tong January 2005 (has links) Doctorat en Sciences / info:eu-repo/semantics/nonPublished Sciences exactes et naturelles Messenger RNA -- Metabolism ARN messager -- Métabolisme
163	Exploration de l'hétérogénéité mutationnelle et de ses conséquences pathologiques dans les myopathies : analyses des mécanismes et développement d'outils thérapeutiques / Exploration of mutational heterogeneity and its pathological consequences in myopathies : analysis of mechanisms and therapeutic tools development Dionnet, Eugénie 29 November 2016 (has links) Aujourd’hui encore, le diagnostic des maladies génétiques et la compréhension des mécanismes pathologiques qui en découlent demeurent difficile. On dénombre à ce jour plus de deux cents formes de myopathies, en majorité d’origine génétique, mais dont les gènes ne sont pas toujours identifiés. Dans le cas où le gène causal est connu, il peut subsister des problèmes diagnostics. L'absence d’information génétique peut alors nuire à la prise en charge des malades ainsi qu’au développement d’outils thérapeutiques. Ma thèse a été conduite dans le but d’améliorer ces éléments : j’ai mis en évidence l’implication d’un nouveau gène dans la dystrophie facio-scapulo-humérale ; optimisé le diagnostic des calpaïnopathies en étudiant l’impact de mutations faux-sens sur l’épissage du gène responsable et analysé les interactions protéiques et ioniques mises en place lors de phénomènes d’entrée calcique. Enfin, j’ai participé au développement d’outils thérapeutiques dans le cadre des dysferlinopathies. / Nowadays, diagnosis and pathomechanisms of genetic disorders remain difficult to explore. There are actually more than 200 forms of myopathies, mostly genetics, even if the culprit gene is not always identified. However, even when the causative gene is known, it often remains diagnostic issues because of clinical and genetic heterogeneity and wide mutational spectrum. The lack of genetic information affects patients cares and impairs the development of new therapeutic tools. My thesis was conducted in order to extend these elements: I have shown that a new gene may be involved in facio-scapulo-humeral dystrophy; I have improved calpainopathie’s diagnosis by studying the impact of missense mutations on RNA splicing; I have also analyzed how proteins contributed to calcium entry in the cell. Finally, I contributed with a new therapeutic tools for dysferlinopathies. Myopathie Calcium Muscle squelettique Arn Myopathy Calcium Skeletal muscle Rna
164	Mécanismes et régulation d'une ARN hélicase essentielle chez E. coli : le facteur de terminaison de la transcription bactérienne Rho / Mechanisms and regulation of an essential RNA helicase in E. coli : the bacterial transcription termination factor Rho Rabhi, Makhlouf 24 February 2011 (has links) Chez E. coli, Rho est un facteur essentiel qui contrôle l’expression de multiples unités transcriptionnelles via le phénomène de terminaison de la transcription. Rho est un moteur moléculaire ATP-dépendant ayant une activité ARN hélicase caractéristique de sa capacité à dissocier des obstacles (comme l’ARN polymérase) lors de sa translocation le long de sa piste ARN. Il existe différentes structures de Rho en interaction avec l’ARN qui suggèrent des mécanismes de translocation contradictoires. Afin de mieux comprendre ces mécanismes, nous avons utilisé deux approches complémentaires pour identifier les fonctionnalités moléculaires importantes au sein de l’ARN et de Rho : l’approche NAIM (Nucleotide Analog Interference Mapping) développée au laboratoire et la mutagenèse dirigée. Nos résultats excluent une organisation de l’anneau hexamérique en «trimère de dimère» (ainsi que les mécanismes de translocation qui en découlent) mais sont compatibles avec différents aspects rencontrés dans une structure en anneau asymétrique plus récente. Toutefois, nos résultats ne supportent pas le mécanisme d’escorte nucléotide par nucléotide qui découle de cette structure asymétrique. Ainsi, nous montrons que Rho contacte la chaîne ARN de façon hétérogène et ne nécessite un groupement 2’-OH que tous les sept nucléotides en moyenne. Par ailleurs, nous avons exploré l’interactome d’E. coli dans le but d’identifier d’éventuels régulateurs de la fonction de Rho. Nous montrons que la protéine hexamèrique Hfq présente une similitude topologique avec les protéines endogènes NusG et YaeO et que, comme elles, Hfq s’associe à Rho pour en réguler la fonction. L’interaction Hfq:Rho inhibe les activités enzymatiques de Rho. Ces résultats révèlent un nouveau mécanisme d’anti-terminaison de la transcription avec diverses implications possibles dans le métabolisme bactérien et/ou la virulence de germes pathogènes. / In E. coli, Rho is an essential factor that controls the expression of multiple transcriptional units via the phenomenon of transcription termination. Rho is an ATP-dependent molecular motor displaying RNA helicase activity, a feature typical of Rho’s ability to dissociate obstacles (such as RNA polymerase) during translocation along its RNA track. Different structures of the Rho-RNA complex have been published and suggest contradictory mechanisms of translocation. In order to understand these mechanisms, we have used two complementary approaches to identify functionality molecular comports in RNA and Rho : the NAIM (Nucleotide Analog Interference Mapping) approach developed in the laboratory and site-directed mutagenesis. Our results exclude that Rho forms a functional "trimer of dimer" ring (which rules out related translocation mechanisms) but are compatible with various aspects encountered in a recent asymmetric ring structure. However, our results do not support the "nucleotide by nucleotide" escort mechanism inferred from this asymmetric structure. Indeed, we show that Rho forms heterogonous contacts with the RNA chain and only requires a 2'-OH every seven nucleotides on average. Furthermore, we explored the interactome of E. coli in order to identify potential regulators of Rho function. We show that the hexameric protein Hfq displays topological similarity with the endogenous proteins NusG and YaeO and, that, like them, Hfq associates with Rho to regulate Rho function. The Hfq:Rho interaction inhibits the enzymatic activities of Rho. These results reveal a novel mechanism of transcription anti-termination with potentially important implications in bacterial metabolism and/or virulence of pathogens. Facteur bactérien Rho ARN hélicase Rho bacterial factor RNA helicase
165	Synthèse d’analogues d’aminoglycosides par voie chimique et ingénierie métabolique : Application à l’étude des ARN par RMN du fluor / Synthesis of analogues of aminoglycoside by chemical and metabolic engineering : Application to the study of RNA by fluorine NMR Lombès, Thomas 26 October 2012 (has links) Les ARN constituent des cibles thérapeutiques extrêmement intéressantes bien qu’encore assez peu exploitées. En effet, les obstacles pour la conception de ligands spécifiques de ces cibles non traditionnelles, polyanioniques et très flexibles, sont encore loin d’être levés. Les aminoglycosides, utilisés depuis longtemps pour leurs propriétés antibiotiques, sont souvent décrits comme des « ligands universels » d’ARN. Leur structure constitue donc une architecture favorable pour l’élaboration de nouveaux ligands spécifiques des ARN.Le but de cette thèse a été de développer une méthode systémique originale combinant chimie organique et microbiologie pour synthétiser de nouvelles molécules de structure analogue aux aminoglycosides, se fixant de façon spécifique sur des cibles ARN. Ce travail repose sur la compréhension récente des voies de biosynthèse des aminoglycosides permettant leur ingénierie rationnelle selon une stratégie de mutasynthèse. Cette approche expérimentale s’appuie sur la conception de mimes de métabolites naturels pouvant être transformés par des bactéries génétiquement modifiées. Le développement de méthodologies novatrices en ingénierie métabolique, synthèse organique et chimie analytique nous a permis de concevoir des analogues d’aminoglycosides fluorés qui se sont avérées être d’excellentes sondes dans l’étude des ARN par RMN du fluor. / Pas de résumé en anglais Aminoglycosides ARN Ligands Biosynthèse Mutasynthèse RMN 19F Chemistry
166	Pre-evolutionary dynamics in autocatalytic RNA networks / Dynamique pré-évolutive des réseaux ARN autocatalytiques Arsene, Simon 12 October 2018 (has links) Les réseaux de molécules interdépendantes sont depuis quelque temps considérés comme de potentiels candidats pour avoir amorcé la transition de la biologie à la chimie. Bien qu'ils aient été intensivement examinés en théorie, il n'existe toujours aucune preuve expérimentale pour confirmer ou infirmer leur supposé rôle crucial dans les origines de la vie. En particulier, il nous manque encore une démonstration empirique des trois ingrédients habituellement présentés comme requis pour l'évolution darwinienne: l'hérédité, la variation et la sélection. Un système qui posséderait les trois tout en étant couplé à un processus de réplication en compartiments serait théoriquement capable d’évoluer au sens darwinien du terme. Par exemple, cela a été montré théoriquement pour les Ensembles Collectivement Autocatalytiques (CAS pour Collectively Aucatalytic Sets en anglais) où chaque molécule de l'ensemble est formée catalytiquement par un autre membre de l'ensemble. Ici, nous utilisons le système de ribozyme Azoarcus, qui catalysent des réactions de recombinaisons, pour former expérimentalement des CASs structurellement divers afin d’explorer leurs propriétés évolutives. Dans ce système, les ribozymes peuvent catalyser la formation d'autres ribozymes à partir de fragments plus petits, présents dans l'environnement. Nous utilisons un dispositif de microfluidique en gouttes associé au séquençage haut-débit pour mener une étude à grande échelle sur des milliers de CASs Azoarcus. Nous développons une approche perturbative pour identifier les paramètres topologiques importants contrôlant les variations observées dans les CAS à la suite de perturbations de l’environnement, ici l'ajout d'une nouvelle espèce. Nous déterminons ensuite l’ensemble restreint de caractéristiques du réseau régissant la mémoire des conditions initiales dans les CASs Azoarcus, un prérequis pour l'hérédité, en utilisant un modèle théorique validé par des données expérimentales. Enfin, nous démontrons qu’il existe dans les CASs Azoarcus des processus cataboliques qui les rendent robustes aux perturbations des fragments qui composent leur substrat et donc plus pertinent d’un point de vue prébiotique. Ces résultats démontrent le rôle crucial des CASs à base d’ARN dans les origines de la vie et illustrent comment la structure de leur réseau peut être adaptée pour obtenir des CASs avec des propriétés intéressantes d’un point de vue évolutif, ouvrant la voie à une démonstration expérimentale de l'évolution darwinienne avec système purement moléculaire. / Networks of interdependent molecules are considered plausible candidates for initiating the transition from biology to chemistry. Though they have been intensively scrutinized theoretically, there is still no experimental evidence for confirming or denying their supposed crucial role in the origins of life. In particular, we are still lacking experimental proofs of any of the three ingredients usually presented as required for Darwinian evolution: heredity, variation and selection. A system that would possess the three while being coupled to some sort of encapsulated replication process would theoretically be able to undergo Darwinian evolution. As a matter of fact, this has been shown theoretically for Collectively Autocatalytic Sets (CAS) where each molecule of the set is catalytically formed by another member of the ensemble. Here we use the Azoarcus recombination ribozyme system to experimentally form structurally diverse CASs to explore their evolutionary properties. In this system, the ribozymes can catalyze the assembly of other ribozymes from smaller fragments, present in the food set. We first use a droplet microfluidics set-up coupled with next-generation sequencing to conduct a large scale study on thousands of Azoarcus CASs. We develop a perturbative approach to identify the important topological parameters that control variations in CASs as a result of environmental perturbations, here the addition of a new species. We then determine the small set of network features governing memory of the initial conditions in Azoarcus CAS, a pre-requisite for heredity, by using a computational model validated by experimental data. Finally, we demonstrate that Azoarcus CAS possess catabolic processes which make them robust to perturbations in the food set and thus more prebiotic relevant. These results provide evidence for the crucial role of RNA CASs in the origins of life and illustrate how the network structure can be tailored to obtain CASs with properties interesting from an evolutionary point of view, paving the way to an experimental demonstration of Darwinian evolution with a purely molecular system. Monde ARN Autocatalyse Réseaux prébiotiques RNA world Autocatalysis Prebiotic networks
167	Etude de la voie TGFβ dans le cholangiocarcinome intrahépatique : implication des ARN longs non-codants / TGFβ signaling pathway in intrahepatic cholangiocarcinoma Merdrignac, Aude 14 June 2019 (has links) Le cholangiocarcinome intra hépatique (CCI) est une tumeur hépatique primitive développée aux dépens des canaux biliaires. Son pronostic est mauvais avec les traitements actuels qui augmentent peu la survie des patients. Sa cancérogénèse est complexe impliquant de nombreuses voies de signalisation dont la voie TGFβ. L’hypothèse du projet est l’implication des ARN longs non-codants (ARNlnc) comme médiateurs de la voie TGFβ dans le développement du CCI. Les objectifs de notre travail étaient d’identifier des ARNlnc régulés par le TGFβ et potentiels biomarqueurs diagnostiques ou pronostiques. Nous avons identifié une signature transcriptomique spécifique du TGFβ après stimulation de lignées cellulaires de CCI. Parmi les nouveaux gènes cibles, plusieurs ARNlnc ont été identifiés dont CASC15 renommé TLINC pour TGFβ-induced long intergenic non-coding RNA. TLINC aurait un rôle dans le remodelage du microenvironnement impliqué dans la cancérogénèse du CCI notamment par la régulation de l’IL8. Ce rôle pourrait s’exercer par l’interaction avec d’autres ARNlnc déjà identifiés dans le CCI e.g. NEAT1. TLINC est surexprimé dans les tumeurs humaines de CCI et pourrait constituer un biomarqueur diagnostique. Des isoformes circulaires de TLINC mises en évidence dans les tumeurs pourraient être détectables dans le sérum et constituer des biomarqueurs non invasifs. L’analyse transcriptomique d’une cohorte de patients divisée en 2 sous-groupes de pronostic différent a identifié une signature d’ARNlnc prédictive de la survie. L’ARNlnc ANRIL, déjà connu dans d’autres cancers, est un des ARNlnc qui pourrait constituer un biomarqueur pronostique. / Intrahepatic cholangiocarcinoma (ICC) is a primary liver tumor developed from bile ducts. ICC prognosis is poor with current treatments that slightly increase patient survival. ICC carcinogenesis is complex and involves multiple signaling pathways including TGFβ pathway. Our hypothesis relies on the involvement of long non-coding RNA (lncRNA) as mediators of TGFβ pathway in the development of ICC. The aim of the study was to identify and to characterize TGFβ regulated lncRNA as ICC potential diagnostic or prognostic biomarkers. We identified a specific transcriptomic signature after stimulation of ICC cell lines with TGFβ. Among the novel TGFβ target genes, several lncRNAs were identified including CASC15 renamed TLINC standing for TGFβ-induced long intergenic non-coding RNA. TLINC may play a role in the remodeling of an inflammatory microenvironment involved in ICC carcinogenesis, including the regulation of IL8. This role could be exerted by the interaction with other lncRNAs already identified in the ICC e.g. NEAT1. TLINC is overexpressed in human ICC tumors and may represent a relevant diagnostic biomarker. Circular isoforms of TLINC found in tumors may be detectable in serum and be noninvasive biomarkers. Transcriptomic analysis of tumors from a cohort of patients divided into 2 prognostic groups identified a lncRNAs signature predictive for survival. LncRNA ANRIL, already known to be upregulated in other cancers, is one of the lncRNAs that could be a prognostic biomarker in ICC. Cancer Foie ARN non codants Cancer Liver Non coding RNA
168	Characterization of the mechanisms of transcription termination by the helicase Sen1 / Caractérisation des mécanismes de terminaison de la transcription par l'hélicase Sen1 Han, Zhong 11 September 2017 (has links) La transcription cachée est un phénomène répandu aussi bien chez les eucaryotes que chez les procaryotes. Elle se caractérise par une production massive d’ARNs non-codants au niveau de régions non-annotées du génome et est potentiellement dangereuse pour la cellule car elle peut interférer avec l’expression normale des gènes. Chez S. cerevisiae, l’hélicase Sen1 induit la terminaison précoce de la transcription non-codante et joue ainsi un rôle clé dans le contrôle de la transcription cachée. Sen1 est très conservée et des mutations dans son homologue humain, senataxin (SETX), ont été associées à des maladies neurodégénératives. Malgré de nombreuses recherches menées sur ces protéines, leurs propriétés biochimiques ainsi que leurs mécanismes d’action restent peu connus. Durant ma thèse, j’ai étudié le mécanisme de terminaison par Sen1.Premièrement, j’ai caractérisé les activités biochimiques de Sen1 et analysé comment elles permettent d’induire la terminaison. Pour cela, j’ai utilisé un ensemble de techniques in vitro, notamment un système de transcription-terminaison qui contient uniquement des composants purifiés : Sen1, l’ARN polymérase II (Pol II) et les ADN matrices. Ce système permet de modifier les différents éléments de façon contrôlée afin de comprendre leur rôle précis dans la terminaison. J’ai tout d’abord analysé la fonction des différents domaines de Sen1 dans la terminaison. Sen1 est une protéine de taille importante qui possède un domaine central catalytique flanqué par deux domaines impliqués dans l’interaction avec d’autres facteurs. J’ai montré que le domaine hélicase est suffisant pour déclencher la terminaison de la transcription in vitro. Ensuite, j’ai montré que Sen1 utilise l’énergie de l’hydrolyse de l’ATP pour se déplacer sur des acides nucléiques simple bras (ARN et ADN) dans le sens 5’ vers 3’. J’ai alors étudié le rôle des différents acides nucléiques du système dans la terminaison par Sen1 et j’ai montré que l’interaction de Sen1 avec l’ADN n’est pas nécessaire; en revanche Sen1 doit s’associer à l’ARN naissant et se déplacer vers la polymérase. J’ai aussi montré qu’une fois que Sen1 entre en collision avec la Pol II, elle y exerce une action mécanique qui conduit à la terminaison uniquement quand la Pol II marque une pause. Cela indique que la terminaison est fortement dépendante de la pause transcriptionnelle. Deuxièmement, en collaboration avec le groupe d’E. Conti, nous avons réalisé une analyse structure-fonction du domaine hélicase de Sen1. Nous avons observé que Sen1 présente une organisation similaire à celle d’autres hélicases proches avec un core composé de deux domaines de type RecA avec plusieurs domaines auxiliaires. En général, le core est très conservé au sein des hélicases proches, alors que les domaines accessoires ont des caractéristiques distinctes qui confèrent des propriétés spécifiques aux différentes hélicases. En effet, nous avons identifié un sous-domaine spécifique à Sen1 mais conservé au cours de l’évolution que nous avons appelé le “brace”. Nous avons également détecté des différences notables au niveau d’un autre domaine accessoire que nous avons nommé le “prong”. Nous avons pu montrer que le “prong” est essentiel pour la terminaison par Sen1. Nos données suggèrent que les caractéristiques structurales spécifiques de Sen1 que nous avons révélées sont des déterminants majeurs de son activité dans la terminaison de la transcription. Finalement, nous avons utilisé Sen1 comme modèle pour étudier des mutations dans SETX qui sont associées à des maladies neurodégénératives. Nous avons introduit chez Sen1 une partie des mutations liées à des maladies et nous avons réalisé une caractérisation biochimique complète de chaque mutant. Nous avons ainsi montré que toutes les mutations sont fortement délétères pour la terminaison de la transcription. En conclusion, nos résultats ont permis d’améliorer la compréhension de l’origine des maladies provoquées par des mutations dans SETX. / Pervasive transcription is a common phenomenon both in eukaryotes and prokaryotes that consists in the massive production of non-coding RNAs from non-annotated regions of the genome. Pervasive transcription poses a risk that needs to be controlled since it can interfere with normal transcription of canonical genes. In S.cerevisiae, the helicase Sen1 plays a key role in restricting pervasive transcription by eliciting early termination of non-coding transcription. Sen1 is highly conserved across species and mutations in the human Sen1 orthologue, senataxin (SETX), are associated with two neurological disorders. Despite the major biological relevance of Sen1 proteins, little is known about their biochemical properties and precise mechanisms of action. During my PhD I have studied in detail the mechanisms of termination by Sen1.In a first project, I have characterized the biochemical activities of Sen1 and investigated how these activities partake in termination. To this end I have employed a variety of in vitro approaches, including a minimal transcription-termination system containing only purified Sen1, RNA polymerase II (RNAPII) and DNA transcription templates that allows modifying the different elements of the system in a controlled manner to understand their role in termination. First, we have analysed the function of the different domains of Sen1 in termination. Sen1 is a large protein composed of a central catalytic domain flanked by additional domains with proposed roles in protein-protein interactions. We have demonstrated that the central helicase domain is sufficient to elicit transcription termination in vitro. Next, we have shown that Sen1 can translocate along single-stranded nucleic acids (both RNA and DNA) from 5’ to 3’. Then, we have analysed the role of the different nucleic acid components of the elongation complex (i.e. nascent RNA and DNA transcription templates) in termination. Our results indicate that termination does not involve the interaction of Sen1 with the DNA but requires Sen1 translocation on the nascent RNA towards the RNAPII. Importantly, we show that upon encountering RNAPII, Sen1 can apply a mechanical force on the polymerase that results in transcription termination when RNAPII is paused under certain conditions. This indicates that RNAPII pausing is a strict requirement for Sen1-mediated termination. In a second project, in collaboration with the group of E. Conti we have performed a structure-function analysis of the helicase domain of Sen1. Comparison of Sen1 structure with that of other related helicases has revealed an overall similar organization consisting in two tandem RecA-like domains from which additional accessory subdomains protrude. In general, the core RecA-like domains are very well conserved among related helicases and most variation is found in the accessory subdomains, that often confer specific characteristics to different helicases. Indeed, we have found that Sen1 contains a unique but evolutionary conserved structural feature that we have dubbed the “brace”. In addition, Sen1 is different from other helicases in an auxiliary subdomain that we have named the “prong”. Importantly, we have shown that the integrity of this subdomain is critical transcription termination by Sen1. We propose that the specific features identified in our structural analyses are important determinants of the transcription termination activity of Sen1. Finally, we have used Sen1 as a model to investigate the molecular effect of SETX mutations linked to neurodegenerative diseases. We have introduced disease-associated mutations in Sen1 and performed a complete biochemical characterization of the different mutants in vitro. Importantly, we found that all mutants were severely affected in transcription termination. Taken together, our results elucidate the key structural determinants of the function of Sen1 and shed light on the molecular origin of the diseases associated with SETX mutations. Sen1 Terminaison de la transcription ARN Sen1 Transcription termination RNA
169	Identifier les variations conduisant au cancer dans le génome non codant et du transcriptome / Identifying cancer driver variations in the non-coding genome andtranscriptome Li, Jia 14 December 2015 (has links) L'annotation fonctionnelle de mutations somatiques est un point focal des études de génomique du cancer. Jusque récemment, la recherche s'est concentré sur des mutations dans la fraction codante du génome, pour lesquelles de puissants outils bioinformatiques ont été développés afin de distinguer des mutations délétères des mutations neutres. On identifie un nombre croissant de variants associés à des maladies dans le génome non-codant. L'interprétation des mutations non-codantes dans le cancer est donc devenue une tâche urgente. Des projets de grande envergure tels que ENCODE ont rendu possible l'interprétation fonctionnelle de variants dans les cancers. Plusieurs programmes ont été produits sur la base de ces informations fonctionnelles. Ces outilssont encore limités, notamment, une bas précision de la prédiction, le manque d'information de la mutation de cancer et biais de constatation importante. Dans le chapitre 2 de cette thèse, pour interpréter fonctionnellement les mutations non-codantes dans les cancers, nous avons développé deux modèles de forêts aléatoires indépendants, appelées SNP et SOM. Compte tenu de la combinaison de caractéristiques fonctionnelles à une position donnée du génome, le modèle SNP prédit la fraction de SNP rares (une mesure de la sélection négative), et le modèle SOM prédit la densité de mutations somatiques attendue à cette position. Nous avons appliqué nos deux modèles pour évaluer des clinvariant and HGMD variants asociés à des maladies, et un ensemble de SNP-contrôle aléatoires. Les résultats ont montré que les variants associés à des maladies ont des scores plus élevés que les SNP-contrôle avec le modèle SNP et inférieures avec le modèle SOM, confortant notre hypothèse selon laquelle la sélection négative, telle que mesurée par fraction de SNP rares et de densité de mutation somatiques, nous informe sur l'impact fonctionnel des mutations tumorales dans le génome non-codant. Jusqu'à présent, les chercheurs ont surtout considéré les gènes protéiques comme critiques dans l'initiation et la progression des cancers. Toutefois, des preuves récentes ont montré que les ARN non-codants, en particulier les lncRNAs, sont activement impliqués dans divers processus de cancer. Un chapitre de cette thèse est consacré à cette classe de transcripts non codants. Comme pour les gènes codants, il pourrait exister un grand nombre de lncRNAs driver de cancer. Le développement d'outils bioinformatiques pour identifier et hiérarchiser les lncRNA et autres ARN non-codants est devenu un important objet de recherche en oncologie.La dernière partie de cette thèse est consacrée à la mise en œuvre de méthodes pour découvrir des éléments non-codants potentiellement driver de cancer. Nous avons d'abord appliqué trois outils tierces, CADD, funSeq2, GWAVA, ainsi que nos modèles SNP et SOM, pour évaluer l'impact des mutations non-codantes dans tout le génome. Pour chaque locus, nous calculons la moyenne des scores de tous les variants observés à l'aide de l'un des modèles, et nous prenons au hasard le même nombre de variants et calculons leur score moyen 1 million de fois pour former une distribution nulle et obtenir une P-valeur pour ce locus. Pour valider notre hypothèse et notre modèle de permutation, nous avons testé ce système sur 452 gènes codants et 61 lncRNA liés au cancer, en utilisant des données de mutation somatique de cancer du foie, cancer du poumon, CLL et mélanome. Nous avons constaté que les lncRNAs et gènes codants associés au cancer avaient des valeurs-P significativement plus faibles que l'ensemble de lncRNAs et gènes codant. Appliquer ce test de permutation à des lncRNAs avec cinq systèmes de notation différents nous a permis de prioriser les centaines de candidats potentiellement liés au cancer.Ces candidats peuvent maintenant être soumis à validation expérimentale. / Functional annotation of somatic mutations have been a consistent hotspot of cancer genomics studies. In the past, researchers preferentially focused on mutations in the coding fraction of the genome, for which ample bioinformatics tools were developed to distinguish cancer-driver mutations from neutral ones. In recent years, as an increasing number of variants were being identified as disease-associated in the non-coding genome, interpreting non-coding cancer mutations has become an urgent task. The completion of large scale projects such as ENCODE, has made functional interpretation of cancer variants achievable, and several programs were produced based on this functional information. However, there still exists some limitations as to these prediction tools, such as low prediction accuracy, lack of cancer mutation information and significant ascertainment bias. In chapter 2 of this thesis, in order to functionally interpret non-coding mutations in cancer, we developed two independent random forest models, referred to as SNP and SOM. Given a combination of features at a given genome positions, the SNP model predicts the expected fraction of rare SNPs (a measure of negative selection), and the SOM model predicts the expected mutation density at this position. We applied our two models to score these non-coding disease-associated clinvariant and HGMD variants and a set of random control SNPs. Results showed that disease-associated variants were scored higher than control SNPs with the SNP model and lower than control SNPs with the SOM model, supporting our hypothesis that purifying selection as measured by fraction of rare SNPs and mutation density is informative for the evaluation of the functional impact of cancer mutations in the non-coding genome. In the past, researchers have preferentially considered protein-coding genes as critical to the initiation and progression of cancers. However, recent evidences have shown that ncRNAs, in particular lncRNAs, are actively implicated in various cancer processes. A chapter of this thesis is devoted to this class of non-coding transcripts. Similar to protein coding genes, there might be a large number of lncRNAs with cancer-driving functions. The development of bioinformatics tools to prioritize them has become a new focus of research for computational oncologists.The last part of this thesis is devoted to the implementation of methods for discovering potential cancer-driving non-coding elements in lncRNA and protein-coding genes. We applied three scoring tools, CADD, funSeq2, GWAVA, together with our SNP and SOM scoring systems to prioritize cancer-associated elements using a permutation-based algorithm. For each locus, we compute the average score of all observed variants using one of the models, and we randomly take the same number of variants and compute their average score 1 million times to form a null distribution and obtain a P value for this locus. To validate our hypothesis and permutation model, we tested this system on 61 cancer-related lncRNA and 452 cancer genes using somatic mutation data from liver cancer, lung cancer, CLL and melanoma. We observed that both cancer lncRNAs and protein-coding genes had significantly lower average P values than total lncRNAs and protein-coding genes in all cases. Applying the permutation test to lncRNAs with five different scoring systems enabled us to prioritize hundreds to thousands of cancer-related lncRNA candidates. These candidates can be used for future experimental validation. Mutation Arn Cancérogène Bioinformatique Mutation Rna Cancer gene Bioinformatics
170	Détection et analyse de motifs structuraux et fonctionnels dans les acides ribonucléiques Gendron, Patrick January 2000 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. ARN Recherche de motifs Isomorphisme de graphe Analyse structurale Détection de régions structurées

Search results