Return to search

Comparaison de structures secondaires d'ARN

L'ARN, acide ribonucléique, est un des composants fondamentaux de la cellule. La majorité des ARN sont constitués d'une séquence orientée de nucléotides notés A,C,G et U. Une telle séquence se replie dans l'espace en formant des liaisons entre les nucléotides deux à deux. La fonction des ARN au sein de la cellule est liée à la conformation spatiale qu'ils adoptent. Ainsi, il est essentiel de pouvoir comparer deux ARN au niveau de leur conformation, par exemple pour déterminer si deux ARN ont la même fonction. On distingue trois niveaux dans la structure d'un ARN. La structure primaire correspond à la séquence de nucléotides, la structure secondaire est constistuée de la liste des liaisons formées entre les nucléotides tandis que la structure tertiaire consiste en la description exacte de la forme tridimensionnelle de la molécule (coordonnées de chaque nucléotide). Bien que la structure tertiaire soit celle qui décrit le mieux la forme spatiale de l'ARN, il est admis que deux ARN ayant une fonction moléculaire similaire ont une structure secondaire proche. Au niveau de la structure secondaire, une fois les liaisons nucléotidiques formées, on peut distinguer des éléments de structure secondaire telles que les hélices, les boucles multiples, les boucles terminales, les boucles internes et les renflements. Essentiellement deux formalismes ont été à ce jour proposés pour modéliser la structure secondaire des ARN. Les séquences annotées par des arcs permettent de représenter la séquence de l'ARN, les arcs codant alors pour les liaisons entre les lettres (nucléotides de la séquence). Les 2-intervalles, généralisation des séquences annotées, sont formés par deux intervalles disjoints. La structure secondaire peut alors être vue comme une famille de 2-intervalles. Enfin, les arbres racinés ordonnés offrent de nombreuses possibilités pour coder la structure secondaire, du niveau nucléotidique au niveau du réseau des boucles multiples. L'un des inconvénients de ces approches est qu'elles modélisent la structure secondaire de l'ARN selon un point de vue particulier (nucléotides, hélices etc). Nous proposons une nouvelle modélisation, appelée RNA-MiGaL, constituée de quatre arbres liés entre eux représentant la structure à différents niveaux de précision. Ainsi, le plus haut niveau code pour le réseau de boucles multiples considéré comme le squelette de la molécule. Le dernier niveau quant à lui détaille les nucléotides. Pour comparer de telles structures nous utilisons la notion de distance d'édition entre deux arbres. Cependant, au vu de certains limitations de celle-ci pour comparer des arbres représentant la structure secondaire à un haut niveau d'abstraction, nous avons introduit une nouvelle distance d'édition qui prend en compte deux nouvelles opérations d'édition: la fusion de noeud et la fusion d'arc. A l'aide de cette nouvelle distance, nous fournissons un algorithme permettant de comparer deux RNA-MiGaLs. Celui-ci est implémenté au sein d'un programme permettant la comparaison de deux structures secondaires d'ARN.

Identiferoai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00637131
Date23 December 2004
CreatorsAllali, Julien
PublisherUniversité de Marne la Vallée
Source SetsCCSD theses-EN-ligne, France
LanguageFrench
Detected LanguageFrench
TypePhD thesis

Page generated in 0.0017 seconds