Spelling suggestions: "subject:"3structure d’rrn"" "subject:"3structure d’nrn""
1 |
Caractérisation structurale et fonctionnelle de l’ARN long non codant MEG3 / Structure-functional studies on lncRNA MEG3Uroda, Tina 09 May 2019 (has links)
Les ARNs long non codants (ARNlnc) jouent un rôle clé dans les processus cellulaires vitaux, notamment le remodelage de la chromatine, la réparation de l'ADN et la traduction. Cependant, la taille et la complexité des ARNlnc présentent des défis sans précédent pour les études moléculaires mécanistiques, de sorte qu'il s'est avéré difficile jusqu'à présent de relier l'information structurelle à la fonction biologique pour les ARNlnc.Le gène 3 humain exprimé maternellement (de l’anglais "maternally expressed gene 3", MEG3), est un ARNlnc abondant, soumis à empreinte parentale et épissé alternativement. Pendant l'embryogenèse, MEG3 contrôle les protéines Polycomb, régulant la différenciation cellulaire, et dans les cellules adultes, MEG3 contrôle p53, régulant la réponse cellulaire aux stress environnementaux. Dans les cellules cancéreuses, MEG3 est régulé négativement, mais la surexpression ectopique de MEG3 réduit la prolifération incontrôlée, ce qui prouve que MEG3 agit comme un suppresseur de tumeur. Les données suggèrent que les fonctions de MEG3 pourraient être régulées par la structure de MEG3. Par exemple, on pense que MEG3 se lie directement aux protéines p53 et Polycomb. De plus, les différents variants d'épissage de MEG3, qui comprennent différents exons et possèdent ainsi des structures potentiellement différentes, présentent des fonctions différentes. Enfin, la mutagenèse par délétion, basée sur une structure de MEG3 prédit in silico, a permis d’identifier un motif MEG3 supposé structuré impliqué dans l'activation de p53. Cependant, au début de mes travaux, la structure expérimentale de MEG3 était inconnue.Pour comprendre la structure et la fonction de MEG3, j'ai utilisé des sondes chimiques in vitro et in vivo pour déterminer la structure secondaire de deux variants humains de MEG3 qui diffèrent par leurs niveaux d'activation de p53. À l'aide d'essais fonctionnels dans les cellules et de mutagenèse, j'ai systématiquement analysé la structure de MEG3 et identifié le noyau activant p53 dans deux domaines (D2 et D3) qui sont conservés structuralement dans les variants humains et conservés dans l’évolution chez les mammifères. Dans D2-D3, les régions structurales les plus importantes sont les hélices H11 et H27, car dans ces régions, j’ai pu supprimer l'activation de p53 grâce à des mutations ponctuelles, un degré de précision jamais atteint pour les autres ARNlnc jusqu’ici. J'ai découvert de manière surprenante que H11 et H27 sont reliés par des boucles connectées l’une à l’autre (de l’anglais "kissing loops") et j'ai confirmé l'importance fonctionnelle de ces interactions de structure tertiaire à longue distance par mutagenèse compensatoire. Allant au-delà de l’état de l’art, j'ai donc essayé de visualiser la structure 3D d’une isoforme de MEG3 longue de 1595 nucléotides, par diffusion de rayons X à petit angle (SAXS), microscopie électronique (EM) et microscopie à force atomique (AFM). Alors que le SAXS et l’EM sont limités par des défis techniques actuellement insurmontables, l’imagerie par AFM m’a permis d’obtenir la première structure 3D à basse résolution de MEG3 et de révéler son échafaudage tertiaire compact et globulaire. Plus remarquable encore, les mêmes mutations qui perturbent la connexion entre les «boucles» H11-H27 et qui inhibent la fonction de MEG3, perturbent aussi la structure 3D de cet ARNlnc, fournissant ainsi le premier lien direct entre la structure 3D et la fonction biologique pour un ARNlnc.Sur la base de mes découvertes, je peux donc proposer un mécanisme de l’activation de p53 basé sur la structure de MEG3, avec des implications importantes pour la compréhension de la cancérogenèse. Plus généralement, mes travaux prouvent que les relations structure-fonction des ARNlnc peuvent être disséquées avec une grande précision et ouvrent la voie à des études analogues visant à obtenir des informations mécanistes pour de nombreux autres ARNlnc d’importance médicale. / Long non-coding RNAs (lncRNAs) are key players in vital cellular processes, including chromatin remodelling, DNA repair and translation. However, the size and complexity of lncRNAs present unprecedented challenges for mechanistic molecular studies, so that connecting structural information with biological function for lncRNAs has proven difficult so far.Human maternally expressed gene 3 (MEG3) is an abundant, imprinted, alternatively-spliced lncRNA. During embryogenesis MEG3 controls Polycomb proteins, regulating cell differentiation, and in adult cells MEG3 controls p53, regulating the cellular response to environmental stresses. In cancerous cells, MEG3 is downregulated, but ectopic overexpression of MEG3 reduces uncontrolled proliferation, proving that MEG3 acts as a tumour suppressor. Evidence suggests that MEG3 functions may be regulated by the MEG3 structure. For instance, MEG3 is thought to bind p53 and Polycomb proteins directly. Moreover, different MEG3 splice variants, which comprise different exons and thus possess potentially different structures, display different functions. Finally, deletion mutagenesis based on a MEG3 structure predicted in silico identified a putatively-structured MEG3 motif involved in p53 activation. However, at the beginning of my work, the experimental structure of MEG3 was unknown.To understand the MEG3 structure and function, I used chemical probing in vitro and in vivo to determine the secondary structure maps of two human MEG3 variants that differ in their p53 activation levels. Using functional assays in cells and mutagenesis, I systematically scanned the MEG3 structure and identified the p53-activating core in two domains (D2 and D3) that are structurally conserved across human variants and evolutionarily conserved across mammals. In D2-D3, the most important structural regions are helices H11 and H27, because in these regions I could tune p53 activation even by point mutations, a degree of precision never achieved for any other lncRNA to date. I surprisingly discovered that H11 and H27 are connected by “kissing loops”, and I confirmed the functional importance of these long-range tertiary structure interactions by compensatory mutagenesis. Going beyond state-of-the-art, I thus attempted to visualize the 3D structure of a 1595-nucleotide long MEG3 isoform by small angle X-ray scattering (SAXS), electron microscopy (EM), and atomic force microscopy (AFM). While SAXS and EM are limited by currently-insurmountable technical challenges, single particle imaging by AFM allowed me to obtain the first low resolution 3D structure of MEG3 and reveal its compact, globular tertiary scaffold. Most remarkably, functionally-disrupting mutations that break the H11-H27 “kissing loops” disrupt such MEG3 scaffold, providing the first direct connection between 3D structure and biological function for an lncRNA.Based on my discoveries, I can therefore propose a structure-based mechanism for p53 activation by human MEG3, with important implications in understanding carcinogenesis. More broadly, my work serves as proof-of-concept that lncRNA structure-function relationships can be dissected with high precision and opens the field to analogous studies aimed to gain mechanistic insights into many other medically-relevant lncRNAs.
|
2 |
Identification de caractéristiques communes et rares dans les ARN structurés dans la base de données RfamEl Korbi, Amell 08 1900 (has links)
Les ARN non codants (ARNnc) sont des transcrits d'ARN qui ne sont pas traduits en protéines et qui pourtant ont des fonctions clés et variées dans la cellule telles que la régulation des gènes, la transcription et la traduction. Parmi les nombreuses catégories d'ARNnc qui ont été découvertes, on trouve des ARN bien connus tels que les ARN ribosomiques (ARNr), les ARN de transfert (ARNt), les snoARN et les microARN (miARN). Les fonctions des ARNnc sont étroitement liées à leurs structures d’où l’importance de développer des outils de prédiction de structure et des méthodes de recherche de nouveaux ARNnc. Les progrès technologiques ont mis à la disposition des chercheurs des informations abondantes sur les séquences d'ARN. Ces informations sont accessibles dans des bases de données telles que Rfam, qui fournit des alignements et des informations structurelles sur de nombreuses familles d'ARNnc. Dans ce travail, nous avons récupéré toutes les séquences des structures secondaires annotées dans Rfam, telles que les boucles en épingle à cheveux, les boucles internes, les renflements « bulge », etc. dans toutes les familles d'ARNnc. Une base de données locale, RNAstem, a été créée pour faciliter la manipulation et la compilation des données sur les motifs de structure secondaire. Nous avons analysé toutes les boucles terminales et internes ainsi que les « bulges » et nous avons calculé un score d’abondance qui nous a permis d’étudier la fréquence de ces motifs. Tout en minimisant le biais de la surreprésentation de certaines classes d’ARN telles que l’ARN ribosomal, l’analyse des scores a permis de caractériser les motifs rares pour chacune des catégories d’ARN en plus de confirmer des motifs communs comme les boucles de type GNRA ou UNCG. Nous avons identifié des motifs abondants qui n’ont pas été étudiés auparavant tels que la « tetraloop » UUUU. En analysant le contenu de ces motifs en nucléotides, nous avons remarqué que ces régions simples brins contiennent beaucoup plus de nucléotides A et U. Enfin, nous avons exploré la possibilité d’utiliser ces scores pour la conception d’un filtre qui permettrait d’accélérer la recherche de nouveaux ARN non-codants. Nous avons développé un système de scores, RNAscore, qui permet d’évaluer un ARN en se basant sur son contenu en motifs et nous avons testé son applicabilité avec différents types de contrôles. / Noncoding RNAs (ncRNAs) are RNA transcripts that are not translated into proteins yet they play important functional roles in the cell including gene regulation, transcription and translation. Among the many categories of ncRNAs that were discovered, we find the well-known ribosomal RNA (rRNA), transfer RNA (tRNA), snoRNA and microRNAs (miRNA). The functions of ncRNAs are tightly linked to their structural features. Thus, understanding and predicting RNA structure as well as developing methods to search for new ncRNAs help to gain insight into these molecules. Technological advances have made available abundant sequence information accessible in databases such as Rfam, which provides alignments and structural information of many ncRNA families. In this research project, we retrieved the information from the Rfam database about the sequences of all secondary structures such as hairpin loops, internal loops, bulges, etc. in all RNA families. A local database, RNAstem, was created to facilitate the use and manipulation of information about secondary structure motifs. We analyzed hairpin loops, bulges and internal loops using the compiled data about the frequencies of occurrence of each loop or bulge and calculated a frequency score. The frequency score is aimed to be an indicator for the abundance of a specific secondary structure motif. While minimizing the bias caused by the high redundancy of some RNA classes as ribosomal RNAs, the frequency score allowed us to identify the rare motifs in each category as well as the common ones. Our findings about the abundant motifs confirm what is already known from previous studies (ex. abundant GNRA or UNCG tetraloops). We found very large gaps between the most abundant and rare RNA structural features. Moreover, we discovered that "A" and "U" dominate single stranded RNA regions, whether they are bulges or loops. We further explored the possibility of using this data to improve current prediction tools for ncRNAs by applying a filter to new candidates. We developed a score system, RNAscore, that evaluates RNAs depending on their motif contents and we tested the program with many different controls.
|
3 |
Le motif d’empaquetage le long du sillon: une nouvelle entité structurale récurrente dans les ARN ribosomiquesGagnon, Matthieu 12 1900 (has links)
La plupart des molécules d’ARN doivent se replier en structure tertiaire complexe afin d’accomplir leurs fonctions biologiques. Cependant, les déterminants d’une chaîne de polynucléotides qui sont nécessaires à son repliement et à ses interactions avec d’autres éléments sont essentiellement inconnus. L’établissement des relations structure-fonction dans les grandes molécules d’ARN passe inévitablement par l’analyse de chaque élément de leur structure de façon individuelle et en contexte avec d’autres éléments. À l’image d’une construction d’immeuble, une structure d’ARN est composée d’unités répétitives assemblées de façon spécifique. Les motifs récurrents d’ARN sont des arrangements de nucléotides retrouvés à différents endroits d’une structure tertiaire et possèdent des conformations identiques ou très similaires. Ainsi, une des étapes nécessaires à la compréhension de la structure et de la fonction des molécules d’ARN consiste à identifier de façon systématique les motifs récurrents et d’en effectuer une analyse comparative afin d’établir la séquence consensus.
L’analyse de tous les cas d’empaquetage de doubles hélices dans la structure du ribosome a permis l’identification d’un nouvel arrangement nommé motif d’empaquetage le long du sillon (AGPM) (along-groove packing motif). Ce motif est retrouvé à 14 endroits dans la structure du ribosome de même qu’entre l’ARN ribosomique 23S et les molécules d’ARN de transfert liées aux sites ribosomaux P et E. Le motif se forme par l’empaquetage de deux doubles hélices via leur sillon mineur. Le squelette sucre-phosphate d’une hélice voyage le long du sillon mineur de l’autre hélice et vice versa. Dans chacune des hélices, la région de contact comprend quatre paires de bases. L’empaquetage le plus serré est retrouvé au centre de l’arrangement où l’on retrouve souvent une paire de bases GU dans une hélice interagissant avec une paire de bases Watson-Crick (WC) dans l’autre hélice. Même si la présence des paires de bases centrales GU versus WC au centre du motif augmente sa stabilité, d’autres alternatives existent pour différents représentants du motif. L’analyse comparative de trois librairies combinatoires de gènes d’AGPM, où les paires de bases centrales ont été variées de manière complètement aléatoire, a montré que le contexte structural influence l’étendue de la variabilité des séquences de nucléotides formant les paires de bases centrales.
Le fait que l’identité des paires de bases centrales puisse varier suggérait la présence d’autres déterminants responsables au maintien de l’intégrité du motif. L’analyse de tous les contacts entre les hélices a révélé qu’en dehors du centre du motif, les interactions entre les squelettes sucre-phosphate s’effectuent via trois contacts ribose-ribose. Pour chacun de ces contacts, les riboses des nucléotides qui interagissent ensemble doivent adopter des positions particulières afin d’éviter qu’ils entrent en collision. Nous montrons que la position de ces riboses est modulée par des conformations spécifiques des paires de bases auxquelles ils appartiennent.
Finalement, un autre motif récurrent identifié à l’intérieur même de la structure de trois cas d’AGPM a été nommé « adenosine-wedge ». Son analyse a révélé que ce dernier est lui-même composé d’un autre arrangement, nommé motif triangle-NAG (NAG-triangle). Nous montrons que le motif « adenosine-wedge » représente un arrangement complexe d’ARN composé de quatre éléments répétitifs, c’est-à-dire des motifs AGPM, « hook-turn », « A-minor » et triangle-NAG. Ceci illustre clairement l’arrangement hiérarchique des structures d’ARN qui peut aussi être observé pour d’autres motifs d’ARN.
D’un point de vue plus global, mes résultats enrichissent notre compréhension générale du rôle des différents types d’interactions tertiaires dans la formation des molécules d’ARN complexes. / Most RNA molecules have to adopt a complex tertiary structure to accomplish their biological functions. However, the important determinants of a polynucleotide chain that are required for its proper folding and its interactions with other elements are essentially unknown. The establishment of structure-function relationships in large RNA molecules goes inevitably through the analysis of each element of their structure separately and in context with other elements. Like a building, an RNA structure is built of repetitive pieces that are glued together in a specific way. These repetitive elements, instead of being bricks, are recurrent motifs. Recurrent RNA motifs are arrangements of nucleotides found in different parts of a tertiary structure and have identical or very similar conformations. Thus, a necessary step toward the understanding of RNA structure and function consists in the systematic identification of recurrent motifs, followed by their comparative analysis and establishment of their sequence consensus.
The analysis of all instances of helical packing within the ribosome structure led to the identification of a new structural arrangement, named the along-groove packing motif (AGPM), which is found in 14 places of the ribosome structure as well as between the 23S ribosomal RNA and the transfer RNA molecules bound to the P and E sites. The motif is formed by the packing of two double helices via their minor grooves. The sugar-phosphate backbone of one helix goes along the minor groove of the other helix and vice versa. In each helix, the contact region includes four base pairs. The closest packing occurs in the center where one can often see a GU base pair packed against a WC base pair. While the presence of the central base pairs GU versus WC in the core of the motif enhances its stability, other alternatives are also present among available structures of the motif. A comparative analysis of three different combinatorial gene libraries of AGPM, in which the central base pairs were fully randomized, shows that the structural context influences the scope of nucleotide sequence variability of the central base pairs.
The fact that the identity of the central base pairs can vary suggested that there are other determinants responsible of the motif’s integrity. Analysis of all other inter-helix contacts has shown that outside the center of the motif the interactions between backbones are made via three ribose-ribose contacts. Within each of these contacts, the riboses of the nucleotides that are in touch adopt particular positions in order to provide for collision-free interactions between them. We show that the position of these riboses is modulated by the specific base pair conformation in which it belongs.
Finally, another recurrent arrangement that occurs within the structure of three cases of AGPM was identified and called the adenosine-wedge. Analysis has shown that the latter motif is itself composed of a smaller arrangement, called the NAG-triangle motif. We show that the adenosine-wedge motif represents a complex RNA arrangement composed of four repetitive elements, AGPM, the hook-turn, the A-minor and the NAG-triangle, which clearly illustrates the hierarchical organisation of the structure that could also occur in other RNA motifs as well.
Altogether, my results enrich our general understanding of the role of different types of tertiary interactions in the formation of large RNA molecules.
|
4 |
Structure and conformational rearrangements during splicing of the ribozyme component of group II introns / Structure et réarrangements conformationnels au cours de l’épissage du composant ribozyme d’un intron de groupe IILi, Cheng-Fang 27 June 2011 (has links)
Les introns de groupe II forment une classe d’ARN connus avant tout pour leur activité ribozymique, qui leur permet de catalyser leur propre réaction d’épissage. Sous certaines conditions, ces introns peuvent s’exciser des ARN précurseurs dont ils font partie et assurer la ligation des exons qui les bordent sans l’aide d’aucune protéine. Les introns de groupe II sont généralement excisés sous forme d’un lariat, semblable à celui formé par les introns des prémessagers nucléaires, dont l’épissage est assurée par le spliceosome. De telles similarités dans le mécanisme d’épissage suggèrent que les introns de groupe II et les introns des prémessagers nucléaires pourraient avoir un ancêtre évolutif commun.Malgré leurs séquences très diverses, les introns de groupe II peuvent être définis par une structure secondaire commune, hautement conservée. Celle-ci est formée de six domaines (domaine I à domaine VI ; D1-D6), émergeant d’une roue centrale. L’épissage des introns de groupe II comprend deux étapes, et autant de réactions de transestérification, qui produisent les exons liés et l’intron excisé sous forme lariat. Il est généralement admis que la structure du ribozyme subit des changements conformationnels entre les deux étapes de l’épissage et que le domaine VI est un acteur clé dans ce phénomène. Cependant, malgré l’identification d’un certain nombre d’interactions tertiaires entre domaines, ni la RMN, ni les études faisant appel à des modifications chimiques ne sont parvenues à déterminer l’environnement immédiat, au niveau du site actif du ribozyme, de l’adénosine qui sert de point de branchement de la structure en lariat, ainsi que des nucléotides qui entourent cette adénosine au sein du domaine VI. A l’aide d’analyses phylogénétiques et d’une modélisation moléculaire tridimensionnelle, nous avons identifié plusieurs sections du ribozyme susceptibles de constituer le site de fixation du domaine VI au cours de l’étape de branchement. Des mutations ont été introduites dans ces sites de fixation potentiels et la cinétique de réaction des ARN mutants résultants a été déterminée. Afin de démontrer formellement l’interaction du domaine VI avec le site récepteur le plus probable, une molécule de ribozyme dont la réaction de branchement est assurée par l’addition d’oligonucléotides ADN ou ARN qui positionnent correctement le domaine VI vis-à-vis de son partenaire a été construite. En combinant l’information apportée par différentes expériences de ce type, nous avons pu générer un modèle à résolution atomique du complexe formé par le domaine VI, son site de branchement et le reste de l’intron au moment où l’épissage est initié. / Group II introns are a class of RNAs best known for their ribozyme-catalyzed, self-splicing reaction. Under certain conditions, the introns can excise themselves from precursor mRNAs and ligate together their flanking exons, without the aid of proteins. Group II introns generally excise from pre-mRNA as a lariat, like the one formed by spliceosomal introns, similarities in the splicing mechanism suggest that group II introns and nuclear spliceosomal introns may share a common evolutionary ancestor.Despite their very diverse primary sequences, group II introns are defined by a highly conserved secondary structure. This generally consists of six domains (Domain I-Domain VI; D1-D6) radiating from a central wheel. Each of the six intronic domains has a specific role in folding, conformational rearrangements or catalysis. The native conformation of a group II intron is sustained by intra- and interdomain long-range tertiary interactions, which are critical either for folding of the intron to the native state or for its catalytic activity. In brief, Domain V interacts with Domain I to form the minimal catalytic core; Domain VI contains a highly conserved bulged adenosine serving as the branch-point nucleotide. DII and Domain III contribute to RNA folding and catalytic efficiency. Domain IV, which encodes the intron ORF, is dispensable for ribozyme activity.Group II intron splicing proceeds through two step transesterification reactions which yield ligated exons and an excised intron lariat. It is initiated by the 2’-hydroxyl group of the bulged adenosine within Domain 6, which serves as a branch point and attacks the phosphate at the 5’-end of the intron, thus releasing the 5’-exon while forming a lariat structure in the first step. The released 5’-exon, which is bound to the intron through base pairing interactions, is then positioned correctly to attack the 3’-splice site with its free 3’-OH in the second step of splicing. It is generally believed that the structure of a group II ribozyme undergoes conformational rearrangements between first step and second step and domain VI must play a central role in the process. However, despite the identification of several interdomain tertiary interactions, neither NMR nor chemical probing studies have been successful in determining the local surroundings of the branch-point adenosine and neighboring domain VI nucleotides in the ribozyme active site. By using phylogenetic analysis and molecular modelling, we have identified several areas of the molecule which have the potential to constitute the docking site of domain VI. Mutations were introduced in putative binding sites and the resulting, mutant RNAs have been kinetically characterized. This has allowed us to identify a site within the ribozyme that appears to be specifically involved in the branching reaction. In order to further investigate the interaction between that site and domain VI, we set up a system in which the docking of domain VI into its presumed binding site is ensured by the addition of DNA/RNA oligos that position the two RNA elements in an appropriate orientation. By combining the information from such experiments, we have built an atomic-resolution model of the complex formed by domain VI, the branch site and the rest of the intron at the time at which splicing is initiated.
|
5 |
Le motif d’empaquetage le long du sillon: une nouvelle entité structurale récurrente dans les ARN ribosomiquesGagnon, Matthieu 12 1900 (has links)
La plupart des molécules d’ARN doivent se replier en structure tertiaire complexe afin d’accomplir leurs fonctions biologiques. Cependant, les déterminants d’une chaîne de polynucléotides qui sont nécessaires à son repliement et à ses interactions avec d’autres éléments sont essentiellement inconnus. L’établissement des relations structure-fonction dans les grandes molécules d’ARN passe inévitablement par l’analyse de chaque élément de leur structure de façon individuelle et en contexte avec d’autres éléments. À l’image d’une construction d’immeuble, une structure d’ARN est composée d’unités répétitives assemblées de façon spécifique. Les motifs récurrents d’ARN sont des arrangements de nucléotides retrouvés à différents endroits d’une structure tertiaire et possèdent des conformations identiques ou très similaires. Ainsi, une des étapes nécessaires à la compréhension de la structure et de la fonction des molécules d’ARN consiste à identifier de façon systématique les motifs récurrents et d’en effectuer une analyse comparative afin d’établir la séquence consensus.
L’analyse de tous les cas d’empaquetage de doubles hélices dans la structure du ribosome a permis l’identification d’un nouvel arrangement nommé motif d’empaquetage le long du sillon (AGPM) (along-groove packing motif). Ce motif est retrouvé à 14 endroits dans la structure du ribosome de même qu’entre l’ARN ribosomique 23S et les molécules d’ARN de transfert liées aux sites ribosomaux P et E. Le motif se forme par l’empaquetage de deux doubles hélices via leur sillon mineur. Le squelette sucre-phosphate d’une hélice voyage le long du sillon mineur de l’autre hélice et vice versa. Dans chacune des hélices, la région de contact comprend quatre paires de bases. L’empaquetage le plus serré est retrouvé au centre de l’arrangement où l’on retrouve souvent une paire de bases GU dans une hélice interagissant avec une paire de bases Watson-Crick (WC) dans l’autre hélice. Même si la présence des paires de bases centrales GU versus WC au centre du motif augmente sa stabilité, d’autres alternatives existent pour différents représentants du motif. L’analyse comparative de trois librairies combinatoires de gènes d’AGPM, où les paires de bases centrales ont été variées de manière complètement aléatoire, a montré que le contexte structural influence l’étendue de la variabilité des séquences de nucléotides formant les paires de bases centrales.
Le fait que l’identité des paires de bases centrales puisse varier suggérait la présence d’autres déterminants responsables au maintien de l’intégrité du motif. L’analyse de tous les contacts entre les hélices a révélé qu’en dehors du centre du motif, les interactions entre les squelettes sucre-phosphate s’effectuent via trois contacts ribose-ribose. Pour chacun de ces contacts, les riboses des nucléotides qui interagissent ensemble doivent adopter des positions particulières afin d’éviter qu’ils entrent en collision. Nous montrons que la position de ces riboses est modulée par des conformations spécifiques des paires de bases auxquelles ils appartiennent.
Finalement, un autre motif récurrent identifié à l’intérieur même de la structure de trois cas d’AGPM a été nommé « adenosine-wedge ». Son analyse a révélé que ce dernier est lui-même composé d’un autre arrangement, nommé motif triangle-NAG (NAG-triangle). Nous montrons que le motif « adenosine-wedge » représente un arrangement complexe d’ARN composé de quatre éléments répétitifs, c’est-à-dire des motifs AGPM, « hook-turn », « A-minor » et triangle-NAG. Ceci illustre clairement l’arrangement hiérarchique des structures d’ARN qui peut aussi être observé pour d’autres motifs d’ARN.
D’un point de vue plus global, mes résultats enrichissent notre compréhension générale du rôle des différents types d’interactions tertiaires dans la formation des molécules d’ARN complexes. / Most RNA molecules have to adopt a complex tertiary structure to accomplish their biological functions. However, the important determinants of a polynucleotide chain that are required for its proper folding and its interactions with other elements are essentially unknown. The establishment of structure-function relationships in large RNA molecules goes inevitably through the analysis of each element of their structure separately and in context with other elements. Like a building, an RNA structure is built of repetitive pieces that are glued together in a specific way. These repetitive elements, instead of being bricks, are recurrent motifs. Recurrent RNA motifs are arrangements of nucleotides found in different parts of a tertiary structure and have identical or very similar conformations. Thus, a necessary step toward the understanding of RNA structure and function consists in the systematic identification of recurrent motifs, followed by their comparative analysis and establishment of their sequence consensus.
The analysis of all instances of helical packing within the ribosome structure led to the identification of a new structural arrangement, named the along-groove packing motif (AGPM), which is found in 14 places of the ribosome structure as well as between the 23S ribosomal RNA and the transfer RNA molecules bound to the P and E sites. The motif is formed by the packing of two double helices via their minor grooves. The sugar-phosphate backbone of one helix goes along the minor groove of the other helix and vice versa. In each helix, the contact region includes four base pairs. The closest packing occurs in the center where one can often see a GU base pair packed against a WC base pair. While the presence of the central base pairs GU versus WC in the core of the motif enhances its stability, other alternatives are also present among available structures of the motif. A comparative analysis of three different combinatorial gene libraries of AGPM, in which the central base pairs were fully randomized, shows that the structural context influences the scope of nucleotide sequence variability of the central base pairs.
The fact that the identity of the central base pairs can vary suggested that there are other determinants responsible of the motif’s integrity. Analysis of all other inter-helix contacts has shown that outside the center of the motif the interactions between backbones are made via three ribose-ribose contacts. Within each of these contacts, the riboses of the nucleotides that are in touch adopt particular positions in order to provide for collision-free interactions between them. We show that the position of these riboses is modulated by the specific base pair conformation in which it belongs.
Finally, another recurrent arrangement that occurs within the structure of three cases of AGPM was identified and called the adenosine-wedge. Analysis has shown that the latter motif is itself composed of a smaller arrangement, called the NAG-triangle motif. We show that the adenosine-wedge motif represents a complex RNA arrangement composed of four repetitive elements, AGPM, the hook-turn, the A-minor and the NAG-triangle, which clearly illustrates the hierarchical organisation of the structure that could also occur in other RNA motifs as well.
Altogether, my results enrich our general understanding of the role of different types of tertiary interactions in the formation of large RNA molecules.
|
6 |
RNA recurrent motifs : identification and characterizationButorin, Yury 04 1900 (has links)
La détermination de la structure tertiaire du ribosome fut une étape importante dans la compréhension du mécanisme de la synthèse des protéines. Par contre, l’élucidation de la structure du ribosome comme tel ne permet pas une compréhension de sa fonction. Pour mieux comprendre la nature des relations entre la structure et la fonction du ribosome, sa structure doit être étudiée de manière systématique. Au cours des dernières années, nous avons entrepris une démarche systématique afin d’identifier et de caractériser de nouveaux motifs structuraux qui existent dans la structure du ribosome et d’autres molécules contenant de l’ARN.
L’analyse de plusieurs exemples d’empaquetage de deux hélices d’ARN dans la structure du ribosome nous a permis d’identifier un nouveau motif structural, nommé « G-ribo ». Dans ce motif, l’interaction d’une guanosine dans une hélice avec le ribose d’un nucléotide d’une autre hélice donne naissance à un réseau d’interactions complexes entre les nucléotides voisins. Le motif G-ribo est retrouvé à 8 endroits dans la structure du ribosome. La structure du G-ribo possède certaines particularités qui lui permettent de favoriser la formation d’un certain type de pseudo-nœuds dans le ribosome.
L’analyse systématique de la structure du ribosome et de la ARNase P a permis d’identifier un autre motif structural, nommé « DTJ » ou « Double-Twist Joint motif ». Ce motif est formé de trois courtes hélices qui s’empilent l’une sur l’autre. Dans la zone de contact entre chaque paire d’hélices, deux paires de bases consécutives sont surenroulées par rapport à deux paires de bases consécutives retrouvées dans l’ARN de forme A. Un nucléotide d’une paire de bases est toujours connecté directement à un nucléotide de la paire de bases surenroulée, tandis que les nucléotides opposés sont connectés par un ou plusieurs nucléotides non appariés. L’introduction d’un surenroulement entre deux paires de bases consécutives brise l’empilement entre les nucléotides et déstabilise l’hélice d’ARN. Dans le motif DTJ, les nucléotides non appariés qui lient les deux paires de bases surenroulées interagissent avec une des trois hélices qui forment le motif, offrant ainsi une stratégie élégante de stabilisation de l’arrangement.
Pour déterminer les contraintes de séquences imposées sur la structure tertiaire d’un motif récurrent dans le ribosome, nous avons développé une nouvelle approche expérimentale. Nous avons introduit des librairies combinatoires de certains nucléotides retrouvés dans des motifs particuliers du ribosome. Suite à l’analyse des séquences alternatives sélectionnées in vivo pour différents représentants d’un motif, nous avons été en mesure d’identifier les contraintes responsables de l’intégrité d’un motif et celles responsables d’interactions avec les éléments qui forment le contexte structural du motif.
Les résultats présentés dans cette thèse élargissent considérablement notre compréhension des principes de formation de la structure d’ARN et apportent une nouvelle façon d’identifier et de caractériser de nouveaux motifs structuraux d’ARN. / Although determination of the ribosome tertiary structure has been an outstanding step towards elucidation of the mechanism of protein synthesis, the complexity of this structure does not provide an easy answer of how this large molecular complex works. In order to understand the nature of structure-function relationships in the ribosome, the ribosome structure itself should be subjected to thorough analysis. In the last years, we undertook systematic efforts toward identification and characterization of all recurrent structural motifs existing in the ribosomal RNA and in other RNA-containing molecules.
The analysis of many instances of helix-helix packing in the ribosome structure allowed us to identify a new structural motif which we called “G-ribo”. In this motif, an interaction of the sugar edge of a guanosine in one helix with the ribose of a nucleotide from another helix was found to be at the origin of a complex network of concomitant inter-nucleotide interactions. In total, the G-ribo motif was found at eight locations within the ribosomal RNA. A surprising feature of this motif consists in its ability to favor the formation of pseudoknots of a particular type. In the ribosome structure, there are four pseudoknots whose formation is mediated by the G-ribo motif.
Systematic analysis of the ribosome as well as the RNAseP crystal structures allowed for the identification of a new RNA motif, which we called “DTJ”, or Double-Twist Joint motif. This motif is made of three short RNA double helices, which stack one on top of another. In the contact zone of each pair of helices two consecutive base pairs are over-twisted compared to the regular helical twist of 32° of A-RNA. One nucleotide of the base pair is always directly connected to the one nucleotide of the over-twisted base pair, while the opposite nucleotides of these base pairs are connected with one or several unpaired nucleotides. Introduction of the helical over-twist between two consecutive base pairs breaks the inter-nucleotide stacking and destabilizes the RNA double helix. In the DTJ, the unpaired nucleotides that connect the two over-twisted base pairs interact with one of the three motif-forming helices, providing an elegant strategy for the stabilization of the whole arrangement.
To determine the nucleotide sequence constraints imposed on the structure of recurrent RNA motifs in the functional ribosome we developed a new approach consisting in the selection of functional ribosomes from a combinatorial gene library in which certain nucleotides of the rRNA gene corresponding to a particular motif were randomized. Comparison of the constraints determined for different examples of the same motif allowed us to distinguish between constraints responsible for the integrity of the motif and for its interaction with surrounding elements, including ribosomal proteins.
The work significantly improves our understanding of the principles of RNA structure formation and opens a new way to identify and characterize RNA motifs.
|
7 |
RNA recurrent motifs : identification and characterizationButorin, Yury 04 1900 (has links)
No description available.
|
8 |
Structural rules for the formation of backbone-backbone interactions between closely packed RNA double helicesTao, Fatou 04 1900 (has links)
Les interactions entre les squelettes sucre-phosphate de nucléotides jouent un rôle important dans la stabilisation des structures tertiaires de larges molécules d’ARN. Elles sont régies par des règles particulières qui gouverne leur formation mais qui jusque là demeure quasiment inconnues. Un élément structural d’ARN pour lequel les interactions sucre-phosphate sont importantes est le motif d’empaquetage de deux doubles hélices d’ARN le long du sillon mineur. Ce motif se trouve à divers endroits dans la structure du ribosome. Il consiste en deux doubles hélices interagissant de manière à ce que le squelette sucre-phosphate de l’une se niche dans le sillon mineur de l’autre et vice versa. La surface de contact entre les deux hélices est majoritairement formée par les riboses et implique au total douze nucléotides. La présente thèse a pour but d’analyser la structure interne de ce motif et sa dépendance de stabilité résultant de l’association optimale ou non des hélices, selon leurs séquences nucléotidiques. Il est démontré dans cette thèse qu’un positionnement approprié des riboses leur permet de former des contacts inter-hélices, par l’entremise d’un choix particulier de l’identité des pairs de bases impliquées. Pour différentes pairs de bases participant à ce contact inter-hélices, l’identité optimale peut être du type Watson-Crick, GC/CG, or certaines pairs de bases non Watson-Crick. Le choix adéquat de paires de bases fournit une interaction inter-hélice stable. Dans quelques cas du motif, l’identité de certaines paires de bases ne correspond pas à la structure la plus stable, ce qui pourrait refléter le fait que ces motifs devraient avoir une liberté de formation et de déformation lors du fonctionnement du ribosome. / Although backbone-backbone interactions play an important role in stabilization of the tertiary structure of large RNA molecules, the particular rules that govern the formation of these interactions remain basically unknown. One RNA structural element for which the backbone-backbone interactions are essential is the along-groove packing motif. This motif is found in numerous locations in the ribosome structure; it consists of two double helices arranged such that the backbone of one helix is packed in the minor groove of the other helix and vice versa. The contact area between the two helices is mostly formed by riboses and totally involves twelve nucleotides. Here we analyze the internal structure of the along-groove packing motif and the dependence of stability of the association of the helices on their nucleotide sequences. We show that the proper positioning of the riboses that allows them to form inter-helix contacts is achieved through the particular choice of the identities of the base pairs involved. For different base pairs participating in the inter-helix contacts the optimal identities can be Watson-Crick, GC/CG, or certain non-Watson-Crick base pairs. The proper choice of the base pairs provides for the stable inter-helix interaction. In some cases of the motif, the identities of certain base pairs do not correspond to the most stable structure, which may reflect the fact that these motifs should break and form during the ribosome function.
|
Page generated in 0.0553 seconds