La cellule eucaryote constitue un système complexe composé d'un grand nombre d'entités, dont trois ensembles particulièrement importants : l'ADN, l'ARN et les protéines. Ces entités vont interagir ensemble et former des complexes ribonucléoprotéiques possédant des activités biochimiques qui vont permettre à la cellule de se réguler et de s'adapter à son milieu. Ces complexes sont des acteurs dans les mécanismes d'expression génique et de régulation. Au cours du siècle dernier, l'étude de ces entités a fait l'objet d'un intérêt tellement important de la part des biologistes qu'elle a donné naissance à un domaine scientifique particulier : la biologie moléculaire. Plus récemment, bien que celle-ci se soit à ses débuts focalisée sur l'ADN et les protéines, les ARN, et leur sous-ensemble les petits ARN non-codants (pARNnc), sont apparus comme des acteurs clés de la régulation de mécanismes cellulaires fondamentaux. En outre, le développement de technologies dites de séquençage à haut débit a permis d'en étudier la diversité des classes. Ainsi, durant les 20 dernières années, des efforts importants ont été consacré à la découverte et à l'étude de nouvelles classes de pARNnc, leur biogenèse et leur fonction. Cependant, l'étude de ces pARNnc par le biais de protocoles de séquençage des pARNnc (pARN-seq) ainsi que les outils bioinformatiques ont été conçus pour concentrer les analyses sur les séquences considérées comme les plus importantes. De ce fait, il apparait généralement que les pARNnc de moins de 15 nucléotides (nt) et ceux issus des ARN ribosomiques ont été presque systématiquement écartés des analyses. Dans le cadre de ce doctorat, nous avons voulu remettre en question cette croyance en préservant l'ARN ribosomique (ARNr) dans nos échantillons, et en abaissant à 8 nt la fenêtre de taille minimale des ARN séquencés. Grâce à cette approche, nous avons justement découvert une nouvelle famille d'ARN exceptionnellement courts qui correspondent à l'extrémité 5' de l'ARNr 5.8S, que nous avons appelé dodécaARN (doARN), reflétant ainsi le nombre de nucléotides de base (12 nt) que contiennent leurs membres. À cet effet, nous avons développé une méthode de détection quantitative afin de confirmer nos données de pARN-Seq, et de valider l'existence de deux doARN (i.e. la séquence minimale de 12 nt doARN, et sa variante portant une cytosine additionnelle en 5', le C-doARN) chez la souris et l'homme. Cette méthode spécifique et sensible est basée sur une ligature assistée par un pont à ADN d'un adaptateur à l'extrémité 5' des doARN, suivie d'une rétro-transcription, et d'amplification quantitative par qPCR. Nous avons ainsi pu confirmer nos résultats de pARN-seq et déterminé que les deux doARN sont plus abondants que certains microARN. La caractérisation de ces ARN nous a conduit à établir que le doARN et le C-doARN sont principalement localisés dans le cytoplasme des cellules, et interagissent avec les ribonucléoprotéines nucléaires hétérogènes (hnRNP) A0, A1 et A2B1, mais pas Argonaute 2. Enfin, l'étude de la régulation de leur expression a permis d'identifier que le niveau du C-doARN était augmenté en cas de privation de sérum, tandis que le doARN était diminué dans les cellules et tissus cancéreux de la prostate humaine comparés à celles et ceux normaux. Plus intéressant encore, nous avons pu établir à l'aide de test de blessure que le CdoARN était capable de réduire la migration/prolifération cellulaire, alors que le do-ARN pourrait fonctionner comme un régulateur global de la traduction. Entre autres, nous avons établi que la présence d'un site de fixation pour le doARN au sein de la séquence 5'UTR d'un ARNm pourrait impacter la traduction de celui-ci. Bien que ces études nous aient permis d'affirmer la présence et la fonctionnalité d'ARN inférieurs à 15 nt, leurs mécanismes d'action, ainsi que leur biogenèse restent néanmoins à être élucidés. Notamment, je porterai une grande attention dans la discussion aux perspectives de recherche concernant l'hypothèse selon laquelle une méthylation spécifique de l'uracile 14 de l'ARNr 5.8S puisse être liée à la génération des doARN / The eukaryotic cell is a complex system composed of many entities, including three particularly important sets: DNA, RNA, and proteins. These entities interact together to form ribonucleoprotein complexes with biochemical activities that allow the cell to regulate and adapt to its environment. These complexes are actors in the mechanisms of gene expression and regulation. During the last century, the study of these entities has been the subject of such great interest by biologists that it has given rise to a particular scientific field: molecular biology. More recently, although molecular biology initially focused on DNA and proteins, RNAs, and their small non-coding RNAs (sRNA) subset, have emerged as key players in the regulation of fundamental cellular mechanisms. In addition, the development of so-called high-throughput sequencing technologies has made it possible to study the diversity of their classes. Thus, during the last 20 years, significant efforts have been devoted to the discovery and study of new classes of ncRNAs, their biogenesis and their function. However, the study of these sRNA through sRNA sequencing protocols (sRNA-seq) as well as bioinformatics pipelines have been designed to focus analyses on the sequences considered most important. As a result, it generally appears that sRNA of less than 15 nucleotides (nt) and those derived from ribosomal RNA were almost systematically excluded from the analyses. In this Ph.D. work, we wanted to challenge this belief by preserving the ribosomal RNA (rRNA) in our samples, and by lowering the minimum size window of sequenced RNA to 8 nt. Thanks to this approach, we discovered a new family of exceptionally short RNA that correspond to the 5' end of the 5.8S rRNA, which we called dodecaRNA (doRNA), reflecting the number of core nucleotides (12 nt) shared by its members. For this purpose, we developed a quantitative detection method to confirm our sRNASeq data, and to validate the existence of two doRNAs (i.e., the minimum 12 nt doRNA sequence, and its variant carrying an additional 5' cytosine, C-doRNA). This specific and sensitive method is based on DNA-bridge-assisted ligation of an adaptor at the 5' end of the doRNAs, followed by retrotranscription, and quantitative amplification by qPCR. We were thus able to confirm our sRNA-seq results and determined that both doRNAs may be more abundant than microRNAs. The characterization of these RNAs led us to establish that doRNA and C-doRNA are mainly localized in the cytoplasm of cells and interact with heterogeneous nuclear ribonucleoproteins (hnRNPs) A0, A1 and A2B1, but not Argonaute 2. Finally, the study of the regulation of their expression identified that the level of C-doRNA was increased during serum deprivation, while doRNA was decreased in human prostate cancer cells and tissues compared to normal cells and tissues. More interestingly, we were able to establish through cell culture wound testing that C-doRNA was able to reduce cell migration/proliferation, while do-RNA could function as a global regulator of translation. Among other things, we established that the presence of a binding site for doRNA within the 5'UTR sequence of an mRNA could impact its translation. Although these studies have allowed us to affirm the presence and functionality of RNA below 15 nt, their mechanisms of action, as well as their biogenesis remain to be elucidated. In particular, I will pay close attention in the discussion to the research prospects concerning the hypothesis that a specific methylation of uracil 14 of 5.8S rRNA can be linked to the generation of our doRNA
Identifer | oai:union.ndltd.org:LAVAL/oai:https://corpus.ulaval.ca:20.500.11794/69052 |
Date | 26 May 2021 |
Creators | Lambert, Marine |
Contributors | Provost, Patrick |
Source Sets | Université Laval |
Language | French |
Detected Language | French |
Type | thèse de doctorat, COAR1_1::Texte::Thèse::Thèse de doctorat |
Format | 1 ressource en ligne (xxiii, 213 pages), application/pdf, application/zip, text/plain |
Page generated in 0.0065 seconds