Return to search

Predicting biomolecular function from 3D dynamics : sequence-sensitive coarse-grained elastic network model coupled to machine learning

La dynamique structurelle des biomolécules est intimement liée à leur fonction, mais très coûteuse à
étudier expériementalement. Pour cette raison, de nombreuses méthodologies computationnelles ont été
développées afin de simuler la dynamique structurelle biomoléculaire. Toutefois, lorsque l'on
s'intéresse à la modélisation des effects de milliers de mutations, les méthodes de simulations
classiques comme la dynamique moléculaire, que ce soit à l'échelle atomique ou gros-grain, sont trop
coûteuses pour la majorité des applications. D'autre part, les méthodes d'analyse de modes normaux
de modèles de réseaux élastiques gros-grain (ENM pour "elastic network model") sont très rapides et
procurent des solutions analytiques comprenant toutes les échelles de temps. Par contre, la majorité
des ENMs considèrent seulement la géométrie du squelette biomoléculaire, ce qui en fait de mauvais
choix pour étudier les effets de mutations qui ne changeraient pas cette géométrie. Le "Elastic
Network Contact Model" (ENCoM) est le premier ENM sensible à la séquence de la biomolécule à
l'étude, ce qui rend possible son utilisation pour l'exploration efficace d'espaces conformationnels
complets de variants de séquence. La présente thèse introduit le pipeline computationel
ENCoM-DynaSig-ML, qui réduit les espaces conformationnels prédits par ENCoM à des Signatures
Dynamiques qui sont ensuite utilisées pour entraîner des modèles d'apprentissage machine simples.
ENCoM-DynaSig-ML est capable de prédire la fonction de variants de séquence avec une précision
significative, est complémentaire à toutes les méthodes existantes, et peut générer de nouvelles
hypothèses à propos des éléments importants de dynamique structurelle pour une fonction moléculaire
donnée. Nous présentons trois exemples d'étude de relations séquence-dynamique-fonction: la
maturation des microARN, le potentiel d'activation de ligands du récepteur mu-opioïde et
l'efficacité enzymatique de l'enzyme VIM-2 lactamase. Cette application novatrice de l'analyse des
modes normaux est rapide, demandant seulement quelques secondes de temps de calcul par variant de
séquence, et est généralisable à toute biomolécule pour laquelle des données expérimentale de
mutagénèse sont disponibles. / The dynamics of biomolecules are intimately tied to their functions but experimentally elusive,
making their computational study attractive. When modelling the effects of thousands of mutations,
time-stepping methods such as classical or enhanced sampling molecular dynamics are too costly for
most applications. On the other hand, normal mode analysis of coarse-grained elastic network models
(ENMs) provides fast analytical dynamics spanning all timescales. However, the vast majority of ENMs
consider backbone geometry alone, making them a poor choice to study point mutations which do not
affect the equilibrium structure. The Elastic Network Contact Model (ENCoM) is the first
sequence-sensitive ENM, enabling its use for the efficient exploration of full conformational spaces
from sequence variants. The present work introduces the ENCoM-DynaSig-ML computational pipeline, in
which the ENCoM conformational spaces are reduced to Dynamical Signatures and coupled to simple
machine learning algorithms. ENCoM-DynaSig-ML predicts the function of sequence variants with
significant accuracy, is complementary to all existing methods, and can generate new hypotheses
about which dynamical features are important for the studied biomolecule's function. Examples given
are the maturation efficiency of microRNA variants, the activation potential of mu-opioid receptor
ligands and the effect of point mutations on VIM-2 lactamase's enzymatic efficiency. This novel
application of normal mode analysis is very fast, taking a few seconds CPU time per variant, and is
generalizable to any biomolecule on which experimental mutagenesis data exist.

Identiferoai:union.ndltd.org:umontreal.ca/oai:papyrus.bib.umontreal.ca:1866/28572
Date08 1900
CreatorsMailhot, Olivier
ContributorsMajor, François, Najmanovich, Rafaël
Source SetsUniversité de Montréal
LanguageEnglish
Detected LanguageFrench
Typethesis, thèse
Formatapplication/pdf

Page generated in 0.002 seconds