Découper, a priori et de façon précise, les séquences en domaines est d'une grande importance dans le champ de la biologie, notamment pour optimiser les études de génomique structurale et de génomique fonctionnelle. Différentes approches basées sur la composition en acides aminés, la complexité de la séquence ou la construction de modèles 3D ab initio, ont été développées par le passé. Nous proposons, dans le cadre de ce travail, une approche nouvelle et originale pour le découpage automatique et sensible des séquences protéiques en domaines structurés distincts par exploitation de leur texture. Cette approche bénéficie de l'information de voisinage 2D apportée par la méthodologie « Hydrophobic Cluster Analysis » (HCA). La distribution des différentes catégories d'amas hydrophobes, tels que définis par l'intermédiaire de HCA, ainsi que l'analyse de leurs caractéristiques en termes de structures secondaires, permettent d'appréhender de façon différenciée les textures des régions globulaires, non globulaires et/ou désordonnées, répétitives, passages membranaires isolés ou multiples.... L'approche développée, DomHCA, permet in fine de segmenter une séquence protéique en une série de régions et sous-régions caractérisées par des textures précises, segmentation qui, appliquée à l'échelle des génomes, autorise une comparaison rapide et originale de l'ensemble des séquences. Une des applications concerne les séquences du génome de Plasmodium falciparum qui, par leurs fortes proportions en acides aminés N et K, rendent les méthodes classiques de détection de similarité peu efficaces.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00011139 |
Date | 05 October 2005 |
Creators | Albeau, Karine |
Publisher | Université de Versailles-Saint Quentin en Yvelines |
Source Sets | CCSD theses-EN-ligne, France |
Language | French |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0019 seconds