La biologie structurale est la branche de la biologie qui étudie la structure et l'organisation spatiale des macromolécules.La biologie structurale concerne en particulier la détermination à l'échelle atomiquede la structure 3D, aux changement de conformation des macromolécules, et à la dynamique de ces structures.De nos jours, les techniques expérimentales modernes telles que la résonance magnétique nucléaire, la cristallographie aux rayons X et plus récemmentla microscopie cryoélectronique peuvent produire des cartes de densité à haute résolution, qui combinées aux informations sur la séquence d'une moléculepermettent aux biologistes de résoudre les structures 3D de la molécule à l'étude.Cependant, dans certains cas, la résolution des cartes de densité n'est pas suffisante.Dans un tel cas, on alignegénéralement des sous-unités individuelles, obtenues à haute résolution, dans la carte de densité de base résolution.Mentionnons qu'il est également également possible de déterminer la structure 3D d'un assemblage biologique en ancrant plusieurs sous-unités ensemble.C'est cependant un problème beaucoup plus difficile.Ces problèmes d'amarrage et d'alignement peuvent être formulés comme un problème d'optimisation dont la fonction de coût est écrite comme la corrélation croisée de deux autres fonctions.Les algorithmes d'ancrage originaux ont été formulés comme des problèmes de "clé et verrou", dans lesquels les protéines étaient considérées comme des corps rigides.Il est cependant naïf de considérer les macromolécules comme des corps rigides. Les protéines sont flexibles et peuventsubir de grands changements conformationnels lors de la liaison à d'autres molécules. Considérer les problèmes d'ancrage comme des problèmes de"clé et verrou" n'est donc pas suffisant.Une méthode d'ancrage flexible standard utilise donc l'approche "aligner puis affiner", qui, dans certains cas, peut omettre de bonnes conformations.Cette thèse se concentre sur deux axes principaux.Le premier axe est le développement d'une nouvelle méthode qui échantillonne de manière exhaustive les mouvements de corps rigides et les mouvements collectifs, calculés par analyse en modes propres (AMP).Nous présentons d'abord une méthode qui utilise la transformée de Fourier rapide pour échantillonner une approximation quadratique de la fonction coût. Ensuite, la méthode effectuela recherche flexible en maximisant l'approximation quadratique de la fonction de coût dans un certain domaine de recherche. Cette méthode garantit de trouver la meilleure conformation flexible.Nous présentons ensuite une version en itterative de notre algorithme, qui trouve les mouvements collectifs qui maximisent le score d'amarrage par rapport aux degrés de liberté (DDLs) du corps rigide.La méthode échantillonne de manière exhaustive à la fois les mouvements de corps rigides et les mouvements collectifs en maximisant le maximum lisse selon les DDls correspondant aux transformations rigides de la fonction coût.Les deux méthodes ont été appliquées à des problèmes d'alignement sur des exemples réels et artificiels.De plus, nous présentons un exemple dans lequel l'approche "aligner puis raffiner" n'est pas capable de trouver la bonne conformation tandis quenotre méthode peut trouver ladite conformation.Le deuxième axe est le développement d'une nouvelle extrapolation des mouvements calculés par l'AMP.Nous montrons qu'il est possible, avec des calculs minimaux, d'extrapoler les mouvements instantanés calculés par l'AMP dans le sous espaces des rotations-traslations des blocs (RTB) comme une rotationpresque pure autour d'un certain axe.Nous avons appliqué cette méthode appelée NOLB sur différents systèmes biologiques et avons pu, d'une part, récupérer des mouvements biologiquement pertinents et d'autre part démontrer que la méthode NOLB génère des structures avec une meilleure topologie qu'une méthode d'AMP linéaire. / Structural biology is a branch of molecular biology, biochemistry, and biophysics concerned with the molecular structure of macromolecules, how they acquire the structures they have,and how alterations in their structures affect their function.These molecules are a topic of interest because they serve to keep the cellsalive and functioning.Nowadays, modern experimental techniques, such as nuclear magnetic resonance (NMR), X-ray crystallography and more recently cryo-electron microscopy (cryo-EM) canproduce high resolution density maps, which combined with the information about the sequence of a molecule allows biologists to solve thethree-dimensional (3D) structures of the molecule under study. However, when studding large biological assemblies, experimental techniques are notalways able to generate density maps with a high enough resolution. In such a case, one typically fits individual sub-units, which weresolved using at a higher resolution, into the lower-resolution density map.Let us also mention that it is also possible determine the 3D structure of a biological assembly by docking several sub-units together.This is a much more difficult problem though.These docking and fitting problems can be reformulated as an optimization problem whose cost function can be written as the cross-correlation of two functions.The first fitting and docking algorithms were formulated as "lock and key" problems, in which the proteins were considered as rigid body.However, considering macromolecules, especially proteins, as rigid bodies is not realistic.Proteins are indeed flexible and can undergo large conformational changesupon binding to other molecules.Considering docking and fitting problems as "lock and key" problems is therefore not sufficient.Therefore, a standard flexible docking/fitting method first uses a six-dimensional (6D) rigid body docking/fitting algorithm and then flexibly relaxes the top docking/fitting poses.This approach will be thus refereed to as to the fit then refine approach.However, in some cases, such an approach can miss good conformations.This thesis focuses on two main axes.The first axis is the development of a new method that exhaustively samples both rigid-body and collective motions computed via normal mode analysis (NMA).We first present a method that combines the advantages of the Fourier transform (FFT)-based exhaustive search, which samples all the conformations of a system under study on a grid, with a local optimization technique thatguarantees to find the nearest optimal off-grid and flexible conformation.The algorithm first samples a quadratic approximation of a scoring function on a 6D grid. Then, the method performs the flexible search by maximizing the quadratic approximation of the cost functionwithin a certain search space.We then present a multi-step version of our algorithm, which finds the collective motions that maximize the docking score with respect to the rigid-body degrees of freedom (DOFs).The method exhaustively samples both rigid-body and collective motions by maximizing the soft maximum over the rigid body DOFs of the docking/fitting cost function.Both methods were applied to docking problems on both real and artificial example and we were able to design a benchmark in which the fit then refine approach fails at finding the correct conformation whileour method succeeds.The second axis is the development of a new extrapolation of motions computed by NMA.We show that it is possible, with minimal computations, to extrapolate the instantaneous motions computed by NMA in the the rotations-translations of blocks (RTB) subspace as an almost pure rotation around a certain axis.We applied this non-linear block (NOLB) method on various biological systems and were able to, firstly, retrieve biologically relevant motions andsecondly, to demonstrate that the NOLB method generates structures with a better topology than a linear NMA method.
Identifer | oai:union.ndltd.org:theses.fr/2018GREAM008 |
Date | 01 February 2018 |
Creators | Hoffmann, Alexandre |
Contributors | Grenoble Alpes, Perrier, Valérie |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | English |
Detected Language | English |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0027 seconds