Return to search

Exploring new applications of a structural alphabet in protein structure analyses / Nouvelles applications autour de l'usage d'un alphabet structural pour l'analyse des structures des protéines

Les alphabets structuraux sont des collections de motifs structuraux répétés dans les structures de protéines. Durant ma thèse, j'ai utilisé l'un d'eux, les blocs protéiques (BPs), pour diverses applications comme la prédiction, la comparaison et l'analyse de structures de protéines. J'ai d'abord étudié les variations structurales observées au sein de structures ayant des séquences protéiques identiques et au cours de simulations de dynamique moléculaire. Les résultats de ces analyses ont été synthétisés sous la forme de matrices de substitution et ont montré des similitudes surprenantes avec les précédentes matrices établies pour les protéines homologues ou les ensembles RMN. La méthode kPRED qui permet de prédire le squelette des protéines sous forme de BPs a été amélioré en prenant en compte les structures locales voisines. La nouvelle version privilégie aussi les informations provenant des protéines homologues lorsqu'elles sont disponibles, atteignant une précision moyenne de 66,3% sur un jeu de données test. J'ai aussi étendu la portée de la base de données PENTAdb pour couvrir l'ensemble des structures de la PDB. Je montre que l'effet de cette augmentation de 950% dans le contenu de PENTAdb améliore notre compréhension de la relation séquence-structure au niveau d'un pentapeptide. J'ai également utilisé PB-ALIGN, un outil de comparaison rapide et efficace de structures des protéines, pour comparer toutes les structures protéiques dans la PDB entre elles et pour étudier les similitudes structurales. J'ai généré une grande collection de données d'alignement et j'explore son usage pour l'annotation fonctionnelle et l'identification de possibles relations évolutives. / Structural motifs found in protein structures. They help in approximating protein structure as a 1D string with minimal loss of structural information. Here I have employed a widely used structural alphabet called Protein Blocks (PB) for various applications like predicting, comparing and analyzing protein structures. PBs were used to study the structural variations in proteins with identical primary structure and also during the course of molecular dynamics (MD) simulations. The results from these analyses were summarized in the form of substitution matrices and showed striking similarities to previously established matrices for homologous proteins and NMR ensembles. I improved kPRED, a knowledge-based prediction of protein backbone in terms of PBs, by taking into consideration the neighboring local structures. The new version of the algorithm also privileges structural information from homologous proteins when available reaching an average accuracy of 66.3% on a benchmark dataset. The scope of the PENTAdb database has been expanded to cover the entire protein structure space in an automated manner. I show that the effect of this 950% increase in the contents of PENTAdb improves our understanding of the sequence-structure relationship at the pentapeptide level. I also used PB-ALIGN, a fast and efficient protein structure comparison tool, to compare all protein structures in PDB in an all-vs-all manner and to investigate PB-based structural similarities. This generated a huge collection of alignment data and I discuss its use for functional annotation and identification of possible evolutionary relationships.

Identiferoai:union.ndltd.org:theses.fr/2017NANT1017
Date30 October 2017
CreatorsVetrivel, Iyanar
ContributorsNantes, Offmann, Bernard, Cadet, Frédéric
Source SetsDépôt national des thèses électroniques françaises
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.002 seconds