11 |
Étude computationnelle du domaine PDZ de Tiam1 / Computational study of the Tiam1 PDZ domainPanel, Nicolas 07 November 2017 (has links)
Les interactions protéine-protéine sont souvent contrôlées par de petits domaines protéiques qui régulent les chemins de signalisation au sein des cellules eucaryotes. Les domaines PDZ sont parmi les domaines les plus répandus et les plus étudiés. Ils reconnaissent spécifiquement les 4 à 10 acides aminés C-terminaux de leurs partenaires. Tiam1 est un facteur d'échange de GTP de la protéine Rac1 qui contrôle la migration et la prolifération cellulaire et dont le domaine PDZ lie les protéines Syndecan-1 (Sdc1), Caspr4 et Neurexine. Des petits peptides ou des molécules peptidomimétiques peuvent potentiellement inhiber ou moduler son activité et être utilisés à des fins thérapeutiques. Nous avons appliqué des approches de dessin computationnel de protéine (CPD) et de calcul d'énergie libre par simulations dynamique moléculaire (DM) pour comprendre et modifier sa spécificité. Le CPD utilise un modèle structural et une fonction d'énergie pour explorer l'espace des séquences et des structures et identifier des variants protéiques ou peptidiques stables et fonctionnels. Nous avons utilisé le programme de CPD Proteus, développé au laboratoire, pour redessiner entièrement le domaine PDZ de Tiam1. Les séquences générées sont similaires à celles des domaines PDZ naturels, avec des scores de similarité et de reconnaissance de pli comparables au programme Rosetta, un outil de CPD très utilisé. Des séquences contenant environ 60 positions mutées sur 90, ont été testées par simulations de DM et des mesures biophysiques. Quatre des cinq séquences testées expérimentalement (par nos collaborateurs) montrent un dépliement réversible autour de 50°C. Proteus a également déterminer correctement la spécificité de la liaison de quelques variants protéiques et peptidiques. Pour étudier plus finement la spécificité, nous avons paramétré un modèle d'énergie libre semi-empirique de Poisson-Boltzmann ayant la forme d'une énergie linéaire d'interaction, ou PB/LIE, appliqué à des conformations issues de simulations de DM en solvant explicite de complexes PDZ:peptide. Avec trois paramètres ajustables, le modèle reproduit correctement les affinités expérimentales de 41 variants, avec une erreur moyenne absolue de 0,4~kcal/mol, et donne des prédictions pour 10 nouveaux variants. Le modèle PB/LIE a ensuite comparé à la méthode non-empirique de calcul d'énergie libre par simulations alchimiques, qui n'a pas de paramètre ajustable et qui prédit correctement l'affinité de 12 complexes Tiam1:peptide. Ces outils et les résultats obtenus devraient nous permettre d'identifier des peptides inhibiteurs et auront d'importantes retombées pour l'ingénierie des interactions PDZ:peptide. / Small protein domains often direct protein-protein interactions and regulate eukaryotic signalling pathways. PDZ domains are among the most widespread and best-studied. They specifically recognize the 4-10 C-terminal amino acids of target proteins. Tiam1 is a Rac GTP exchange factor that helps control cellmigration and proliferation and whose PDZ domain binds the proteins syndecan-1 (Sdc1), Caspr4, and Neurexin. Short peptides and peptidomimetics can potentially inhibit or modulate its action and act as bioreagents or therapeutics. We used computational protein design (CPD) and molecular dynamics (MD) free energy simulations to understand and engineer its peptide specificity. CPD uses a structural model and an energy function to explore the space of sequences and structures and identify stable and functional protein or peptide variants. We used our in-house Proteus CPD package to completely redesign the Tiam1 PDZ domain. The designed sequences were similar to natural PDZ domains, with similarity and fold recognition scores comarable to the widely-used Rosetta CPD package. Selected sequences, containing around 60 mutated positions out of 90, were tested by microsecond MD simulations and biophysical experiments. Four of five sequences tested experimentally (by our collaborators) displayed reversible unfolding around 50°C. Proteus also accurately scored the binding specificity of several protein and peptide variants. As a more refined model for specificity, we parameterized a semi-empirical free energy model of the Poisson-Boltzmann Linear Interaction Energy or PB/LIE form, which scores conformations extracted from explicit solvent MD simulations of PDZ:peptide complexes. With three adjustable parameters, the model accurately reproduced the experimental binding affinities of 41 variants, with a mean unsigned error of just 0.4 kcal/mol, andgave predictions for 10 new variants. The PB/LIE model was tested further by comparing to non-empirical, alchemical, MD free energy simulations, which have no adjustable parameters and were found to give chemical accuracy for 12 Tiam1:peptide complexes. The tools and insights obtained should help discover new tight binding peptides or peptidomimetics and have broad implications for engineering PDZ:peptide interactions.
|
12 |
Computer simulations to engineer PDZ-peptide recognition / Simulations numériques pour le dessin des interactions PDZ : peptideVilla, Francesco 23 October 2018 (has links)
Les interactions protéine-protéine (IPPs) médient la signalisation cellulaire. Leur ingénierie peut fournir des informations et conduire au développement de molécules thérapeutiques. Les domaines PDZ sont des médiateurs importants de IPPs. Elles lient les 4--10 résidus C-terminaux de protéines cibles. Elles lient aussi les peptides correspondants, qui peuvent servir de systèmes modèles ou d'inhibiteurs. Nous avons développé deux approches computationnelles et les avons appliquées au domaine PDZ de la protéine Tiam1, un facteur d'échange pour la protéine Rac, impliqué dans la protrusion neuronale. Sa cible est la protéine Syndecan1. Des affinités expérimentales sont connues pour le peptide C-terminal, noté Sdc1, et plusieurs mutants; elles ont servi pour tester les calculs. Nous avons d'abord développé une méthode de dessin computationnel haut débit. Une simulation Monte Carlo est faite où les chaines latérales de la protéine et du peptide peuvent changer de conformères et certaines positions peuvent muter. Le solvant est implicite. Le paysage énergétique est aplati par la méthode adaptative de Wang-Landau, de sorte qu'un vaste ensemble de variantes est échantillonné. Effectuant des simulations distinctes du complexe et du peptide seul nous avons obtenu les énergies libres relatives d'association de 75,000 variantes en heure CPU sur une machine de bureau. Les valeurs sont compatibles avec les quelques données expérimentales disponibles. Ensuite, nous avons développé une approche beaucoup plus détaillée et réaliste. Soluté et solvant sont décrits par un champ de force atomique, qui représente explicitement la polarisation électronique: le champ de force Drude de Charmm. La polarisabilité peut être importante car les résidus de l'interface PDZ:peptide passent, lors de l'association, d'un environnement riche en solvant à un autre pauvre en solvant. Nous avons fait des simulations alchimiques d'énergie libre pour comparer quatre variantes du peptide qui diffèrent par une ou deux chaines latérales ioniques. Les résultats sont en bon accord avec l'expérience. Les champs de force additifs Charmm et Amber, qui représentent la polarisabilité implicitement, donnent un moins bon accord. Ces calculs sont le premier exemple de simulations alchimiques d'énergies libre d'association relatives protéine: ligand avec un champ de force polarisable. Enfin, pour une modélisation future de peptides phosphorylés, nous avons étendu le champ de force Drude pour inclure le méthyl phosphate et la phospho tyrosine. Il en résulte un excellent accord avec les affinités expérimentales phosphate: magnésium. / Protein-protein interactions (PPIs) regulate complex signaling networks in eukaryotic cells. Many binding events between several protein domains transfer information through communication pathways. Disrupting or altering the equilibrium between PPIs plays an important role inseveral diseases and the inibition of targeted PPIs is a recognized strategy for computational drug design. In the present thesis we focused on PDZ domains, which are among the most widespread signaling domains. PDZs recognize the 4-10 C-terminal amino acids of their target proteins as well as the corresponding peptides in isolation. We studied PDZ:peptide binding for the Tiam1 protein, which is a Rac GTP exchange factor involved in neuronal protrusion and axon guidance. Tiam1 activity modulates signaling for cell proliferation and migration, whose dysregulation increases growth of metastatic cancers. Its natural binder peptide is Syndecan1 (Sdc1), composed of 8 amino acids. Its last 5 Cter residues drive interactions in the binding pocket. Experimental affinities for several mutants of Sdc1 and in the protein domain constitute a complete dataset to study many ionic interactions with molecular simulations. These calculations are still challenging, despite the dramatic improvement of biomolecular modelling in the 1990's and 2000's. Upon binding, residues are transferred from a solvent-exposed environment to a solvent-poor one. This is expected to change the electron distribution within residues and nearby solvent molecules. Comparing ligands that differ by one or more ionic side-chain mutations, more sophisticated force fields where electronic polarizability is treated explicitly may be required. We developed and tested both Computational Protein Design (CPD) models and more precise free energy calculation methods based on polarizable molecular dynamics. We developed a general, high-througtput CPD protocol to optimize protein:peptide binding. The model has been implemented in on our in-house CPD package Proteus ( Simonson et al, 2014) and has been tested computing relative binding affinities for many variants of the Tiam1:Sdc1 complex. Monte Carlo sampling of equilibrium distributions of protein sequences is performed using an adaptive bias potential which flattens the energy landscape in sequence space and allows to estimate binding affinities for thousands of protein variants in limited CPU time (~1hour). We also improved our CPD implicit solvent model, implementing a more realistic description of the solute-solvent dielectric boundary. The new method, called Fluctuating Dielectric Boundary (FDB) showed a systematic improvement in the prediction of acid:base constants of several proteins. Promising results were also obtained for the complete sequence redesign of three PDZ domains. In the second part of this work we studied Tiam1:peptide affinities with more sophisticated models, based on free energy simulations with the Drude Polarizable Force field (DrudeFF). We first computed relative binding free energies for charge mutations in the Tiam1:Sdc1 complex, obtaining a clear improvement respect to equivalent calculations performed using two additive force fields. We applied the well-enstablished Dual Topology Approach: to our knowledge, this was the first example of such a calculation for a protein:peptide complex with uses the DrudeFF. Then we went on, developing the Drude polarizable models for methyl phosphate (MP) and phospho tyrosine (pTyr). We were interested in the change in binding affinity associated with phosphorylation of a Tyrosine residue of Sdc1, but Drude pTyr parameters were not yet developed. We tested our new phosphate parameters studying standard binding free energies between MP and magnesium (Mg2+) in water solution. Results showed a good agreement with experiment, improving previous calculations performed using additive force field
|
13 |
Computational protein design: assessment and applicationsLi, Zhixiu January 2015 (has links)
Indiana University-Purdue University Indianapolis (IUPUI) / Computational protein design aims at designing amino acid sequences that can fold into a target structure and perform a desired function. Many computational design methods have been developed and their applications have been successful during past two decades. However, the success rate of protein design remains too low to be of a useful tool by biochemists whom are not an expert of computational biology. In this dissertation, we first developed novel computational assessment techniques to assess several state-of-the-art computational techniques. We found that significant progresses were made in several important measures by two new scoring functions from RosettaDesign and from OSCAR-design, respectively. We also developed the first machine-learning technique called SPIN that predicts a sequence profile compatible to a given structure with a novel nonlocal energy-based feature. The accuracy of predicted sequences is comparable to RosettaDesign in term of sequence identity to wild type sequences. In the last two application chapters, we have designed self-inhibitory peptides of Escherichia coli methionine aminopeptidase (EcMetAP) and de novo designed barstar. Several peptides were confirmed inhibition of EcMetAP at the micromole-range 50% inhibitory concentration. Meanwhile, the assessment of designed barstar sequences indicates the improvement of OSCAR-design over RosettaDesign.
|
14 |
Contributions au développement d'outils computationnels de design de protéine : méthodes et algorithmes de comptage avec garantie / Contribution to protein design tools : counting methods and algorithmsViricel, Clement 18 December 2017 (has links)
Cette thèse porte sur deux sujets intrinsèquement liés : le calcul de la constante de normalisation d’un champ de Markov et l’estimation de l’affinité de liaison d’un complexe de protéines. Premièrement, afin d’aborder ce problème de comptage #P complet, nous avons développé Z*, basé sur un élagage des quantités de potentiels négligeables. Il s’est montré plus performant que des méthodes de l’état de l’art sur des instances issues d’interaction protéine-protéine. Par la suite, nous avons développé #HBFS, un algorithme avec une garantie anytime, qui s’est révélé plus performant que son prédécesseur. Enfin, nous avons développé BTDZ, un algorithme exact basé sur une décomposition arborescente qui a fait ses preuves sur des instances issues d’interaction intermoléculaire appelées “superhélices”. Ces algorithmes s’appuient sur des méthodes issuse des modèles graphiques : cohérences locales, élimination de variable et décompositions arborescentes. A l’aide de méthodes d’optimisation existantes, de Z* et des fonctions d’énergie de Rosetta, nous avons développé un logiciel open source estimant la constante d’affinité d’un complexe protéine protéine sur une librairie de mutants. Nous avons analysé nos estimations sur un jeu de données de complexes de protéines et nous les avons confronté à deux approches de l’état de l’art. Il en est ressorti que notre outil était qualitativement meilleur que ces méthodes. / This thesis is focused on two intrinsically related subjects : the computation of the normalizing constant of a Markov random field and the estimation of the binding affinity of protein-protein interactions. First, to tackle this #P-complete counting problem, we developed Z*, based on the pruning of negligible potential quantities. It has been shown to be more efficient than various state-of-the-art methods on instances derived from protein-protein interaction models. Then, we developed #HBFS, an anytime guaranteed counting algorithm which proved to be even better than its predecessor. Finally, we developed BTDZ, an exact algorithm based on tree decomposition. BTDZ has already proven its efficiency on intances from coiled coil protein interactions. These algorithms all rely on methods stemming from graphical models : local consistencies, variable elimination and tree decomposition. With the help of existing optimization algorithms, Z* and Rosetta energy functions, we developed a package that estimates the binding affinity of a set of mutants in a protein-protein interaction. We statistically analyzed our esti- mation on a database of binding affinities and confronted it with state-of-the-art methods. It appears that our software is qualitatively better than these methods.
|
Page generated in 0.1148 seconds