Return to search

Analyse à grande échelle des textures des séquences protéiques via l'approche Hydrophobic Cluster Analysis (HCA).

Découper, a priori et de façon précise, les séquences en domaines est d'une grande importance dans le champ de la biologie, notamment pour optimiser les études de génomique structurale et de génomique fonctionnelle. Différentes approches basées sur la composition en acides aminés, la complexité de la séquence ou la construction de modèles 3D ab initio, ont été développées par le passé. Nous proposons, dans le cadre de ce travail, une approche nouvelle et originale pour le découpage automatique et sensible des séquences protéiques en domaines structurés distincts par exploitation de leur texture. Cette approche bénéficie de l'information de voisinage 2D apportée par la méthodologie « Hydrophobic Cluster Analysis » (HCA). La distribution des différentes catégories d'amas hydrophobes, tels que définis par l'intermédiaire de HCA, ainsi que l'analyse de leurs caractéristiques en termes de structures secondaires, permettent d'appréhender de façon différenciée les textures des régions globulaires, non globulaires et/ou désordonnées, répétitives, passages membranaires isolés ou multiples.... L'approche développée, DomHCA, permet in fine de segmenter une séquence protéique en une série de régions et sous-régions caractérisées par des textures précises, segmentation qui, appliquée à l'échelle des génomes, autorise une comparaison rapide et originale de l'ensemble des séquences. Une des applications concerne les séquences du génome de Plasmodium falciparum qui, par leurs fortes proportions en acides aminés N et K, rendent les méthodes classiques de détection de similarité peu efficaces.

Identiferoai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00011139
Date05 October 2005
CreatorsAlbeau, Karine
PublisherUniversité de Versailles-Saint Quentin en Yvelines
Source SetsCCSD theses-EN-ligne, France
LanguageFrench
Detected LanguageFrench
TypePhD thesis

Page generated in 0.0016 seconds