La plupart des molécules d’ARN doivent se replier en structure tertiaire complexe afin d’accomplir leurs fonctions biologiques. Cependant, les déterminants d’une chaîne de polynucléotides qui sont nécessaires à son repliement et à ses interactions avec d’autres éléments sont essentiellement inconnus. L’établissement des relations structure-fonction dans les grandes molécules d’ARN passe inévitablement par l’analyse de chaque élément de leur structure de façon individuelle et en contexte avec d’autres éléments. À l’image d’une construction d’immeuble, une structure d’ARN est composée d’unités répétitives assemblées de façon spécifique. Les motifs récurrents d’ARN sont des arrangements de nucléotides retrouvés à différents endroits d’une structure tertiaire et possèdent des conformations identiques ou très similaires. Ainsi, une des étapes nécessaires à la compréhension de la structure et de la fonction des molécules d’ARN consiste à identifier de façon systématique les motifs récurrents et d’en effectuer une analyse comparative afin d’établir la séquence consensus.
L’analyse de tous les cas d’empaquetage de doubles hélices dans la structure du ribosome a permis l’identification d’un nouvel arrangement nommé motif d’empaquetage le long du sillon (AGPM) (along-groove packing motif). Ce motif est retrouvé à 14 endroits dans la structure du ribosome de même qu’entre l’ARN ribosomique 23S et les molécules d’ARN de transfert liées aux sites ribosomaux P et E. Le motif se forme par l’empaquetage de deux doubles hélices via leur sillon mineur. Le squelette sucre-phosphate d’une hélice voyage le long du sillon mineur de l’autre hélice et vice versa. Dans chacune des hélices, la région de contact comprend quatre paires de bases. L’empaquetage le plus serré est retrouvé au centre de l’arrangement où l’on retrouve souvent une paire de bases GU dans une hélice interagissant avec une paire de bases Watson-Crick (WC) dans l’autre hélice. Même si la présence des paires de bases centrales GU versus WC au centre du motif augmente sa stabilité, d’autres alternatives existent pour différents représentants du motif. L’analyse comparative de trois librairies combinatoires de gènes d’AGPM, où les paires de bases centrales ont été variées de manière complètement aléatoire, a montré que le contexte structural influence l’étendue de la variabilité des séquences de nucléotides formant les paires de bases centrales.
Le fait que l’identité des paires de bases centrales puisse varier suggérait la présence d’autres déterminants responsables au maintien de l’intégrité du motif. L’analyse de tous les contacts entre les hélices a révélé qu’en dehors du centre du motif, les interactions entre les squelettes sucre-phosphate s’effectuent via trois contacts ribose-ribose. Pour chacun de ces contacts, les riboses des nucléotides qui interagissent ensemble doivent adopter des positions particulières afin d’éviter qu’ils entrent en collision. Nous montrons que la position de ces riboses est modulée par des conformations spécifiques des paires de bases auxquelles ils appartiennent.
Finalement, un autre motif récurrent identifié à l’intérieur même de la structure de trois cas d’AGPM a été nommé « adenosine-wedge ». Son analyse a révélé que ce dernier est lui-même composé d’un autre arrangement, nommé motif triangle-NAG (NAG-triangle). Nous montrons que le motif « adenosine-wedge » représente un arrangement complexe d’ARN composé de quatre éléments répétitifs, c’est-à-dire des motifs AGPM, « hook-turn », « A-minor » et triangle-NAG. Ceci illustre clairement l’arrangement hiérarchique des structures d’ARN qui peut aussi être observé pour d’autres motifs d’ARN.
D’un point de vue plus global, mes résultats enrichissent notre compréhension générale du rôle des différents types d’interactions tertiaires dans la formation des molécules d’ARN complexes. / Most RNA molecules have to adopt a complex tertiary structure to accomplish their biological functions. However, the important determinants of a polynucleotide chain that are required for its proper folding and its interactions with other elements are essentially unknown. The establishment of structure-function relationships in large RNA molecules goes inevitably through the analysis of each element of their structure separately and in context with other elements. Like a building, an RNA structure is built of repetitive pieces that are glued together in a specific way. These repetitive elements, instead of being bricks, are recurrent motifs. Recurrent RNA motifs are arrangements of nucleotides found in different parts of a tertiary structure and have identical or very similar conformations. Thus, a necessary step toward the understanding of RNA structure and function consists in the systematic identification of recurrent motifs, followed by their comparative analysis and establishment of their sequence consensus.
The analysis of all instances of helical packing within the ribosome structure led to the identification of a new structural arrangement, named the along-groove packing motif (AGPM), which is found in 14 places of the ribosome structure as well as between the 23S ribosomal RNA and the transfer RNA molecules bound to the P and E sites. The motif is formed by the packing of two double helices via their minor grooves. The sugar-phosphate backbone of one helix goes along the minor groove of the other helix and vice versa. In each helix, the contact region includes four base pairs. The closest packing occurs in the center where one can often see a GU base pair packed against a WC base pair. While the presence of the central base pairs GU versus WC in the core of the motif enhances its stability, other alternatives are also present among available structures of the motif. A comparative analysis of three different combinatorial gene libraries of AGPM, in which the central base pairs were fully randomized, shows that the structural context influences the scope of nucleotide sequence variability of the central base pairs.
The fact that the identity of the central base pairs can vary suggested that there are other determinants responsible of the motif’s integrity. Analysis of all other inter-helix contacts has shown that outside the center of the motif the interactions between backbones are made via three ribose-ribose contacts. Within each of these contacts, the riboses of the nucleotides that are in touch adopt particular positions in order to provide for collision-free interactions between them. We show that the position of these riboses is modulated by the specific base pair conformation in which it belongs.
Finally, another recurrent arrangement that occurs within the structure of three cases of AGPM was identified and called the adenosine-wedge. Analysis has shown that the latter motif is itself composed of a smaller arrangement, called the NAG-triangle motif. We show that the adenosine-wedge motif represents a complex RNA arrangement composed of four repetitive elements, AGPM, the hook-turn, the A-minor and the NAG-triangle, which clearly illustrates the hierarchical organisation of the structure that could also occur in other RNA motifs as well.
Altogether, my results enrich our general understanding of the role of different types of tertiary interactions in the formation of large RNA molecules.
Identifer | oai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMU.1866/2898 |
Date | 12 1900 |
Creators | Gagnon, Matthieu |
Contributors | Chteinberg, Serguei |
Source Sets | Library and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada |
Language | French |
Detected Language | French |
Type | Thèse ou Mémoire numérique / Electronic Thesis or Dissertation |
Page generated in 0.0027 seconds