Dockingbasierte Ansätze zählen zu den wichtigsten Komponenten im virtuellen Screening. Sie dienen der Vorhersage der Ligandposition und -konformation in der Bindetasche sowie der Abschätzung der Bindungsaffinität zum Protein. Bis heute stellt die korrekte Identifizierung proteingebundener Ligandkonformationen ein noch nicht vollständig gelöstes Problem für Scoringfunktionen dar. Der erste Teil der vorliegenden Arbeit ist daher der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gewidmet.
Der Fokus eines ersten Teilprojektes lag auf der Berücksichtigung der Absättigung vergrabener Wasserstoffbrückenakzeptoren (HBA) und -donoren (HBD) bei der Bewertung von Docking-Lösungen. Nicht-abgesättigte vergrabene HBA und HBD stellen einen der Bindungsaffinität abträglichen Beitrag dar, der bis dato aufgrund fehlender Struktur- bzw. Affinitätsdaten in Scoringfunktionen vernachlässigt wird. Im Rahmen der vorliegenden Arbeit wurde auf der Basis einer detaillierten Untersuchung zur Häufigkeit vergrabener nicht-abgesättigter HBA und HBD in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes eine empirische Filterfunktion („vnaHB“-Filterfunktion) entwickelt, die unerwünschte Ligandbindeposen erkennt und von der Bewertung mittels Scoringfunktionen ausschließt. Der praktische Nutzen der empirischen Filterfunktion wurde für die Scoringfunktionen SFCscore und DSX anhand vorgenerierter Docking-Lösungen des Cheng-Datensatzes untersucht. Die Häufigkeitsuntersuchung zeigt, dass eine Absättigung vergrabener polarer Gruppen in Protein-Ligand-Komplexen für eine hochaffine Protein-Ligand-Bindung notwendig ist, da vergrabene nicht-abgesättigte HBA und HBD nur selten auftreten. Eine vollständige Absättigung durch entsprechende Proteinpartner wird für ca. 48 % der untersuchten Komplexe beobachtet, ca. 92 % weisen weniger als drei hauptsächlich schwache, nicht-abgesättigte HBA bzw. HBD (z. B. Etherfunktionen) auf. Unter Einbeziehung von Wassermolekülen in die Häufigkeitsanalyse sind sogar für ca. 61 % aller Komplexe alle wasserstoffbrückenbindenden Gruppen abgesättigt. Im Gegensatz zu DSX werden für SFCscore nach Anwendung der empirischen Filterfunktion erhöhte Erfolgsraten für das Auffinden einer kristallnahen Pose (≤ 2.0 Å Abweichung) unter den am besten bewerteten Docking-Posen erzielt. Für die beste SFCscore-Funktion (SFCscore::229m) werden Steigerungen dieses als „Docking Power“ bezeichneten Kriteriums für die Top-3-Posen (Erfolgsrate für die Identifizierung einer kristallnahen 2.0 Å Pose unter den besten drei Docking-Lösungen) von 63.1 % auf 64.2 % beobachtet.
In einem weiteren Teilprojekt wurden repulsive Protein-Ligand-Kontakte infolge sterischer Überlappungen der Bindungspartner bei der Bewertung von Docking-Lösungen berücksichtigt. Die adäquate Einbeziehung solcher repulsiver Kontakte im Scoring ist für die Identifizierung proteingebundener Ligandkonformationen entscheidend, jedoch aufgrund fehlender Affinitäts- bzw. Strukturdaten problematisch. Im Rahmen der vorliegenden Arbeit wurde auf der Basis des Lennard-Jones-Potentiales des AMBER-Kraftfeldes zunächst ein neuer Deskriptor zur Beschreibung repulsiver Kontakte („Clash“-Deskriptor) entwickelt und zur Untersuchung der Häufigkeit ungünstiger Protein-Ligand-Kontakte in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes herangezogen. Eine aus der Häufigkeitsverteilung abgeleitete empirische Filterfunktion („Clash“-Filterfunktion) wurde anschließend der Bewertung von Docking-Lösungen des Cheng-Datensatzes mittels der Scoringfunktionen SFCscore und DSX vorgeschaltet, um unerwünschte Ligandbindeposen auszuschließen. Die Häufigkeitsuntersuchung zeigt, dass vorwiegend schwache repulsive Kontakte in Protein-Ligand-Komplexen auftreten. So werden in 75 % der Komplexe des Hartshorn-Datensatzes abstoßende Potentiale unter 0.462 kcal/mol beobachtet. Zwar betragen die ungünstigen Beiträge pro Komplex für 50 % aller Strukturen ca. 0.8 kcal/mol bis 2.5 kcal/mol, jedoch können diese auf Ungenauigkeiten der Kristallstrukturen zurückzuführen sein bzw. durch günstige Protein-Ligand-Wechselwirkungen kompensiert werden. Die Anwendung der „Clash“-Filterfunktion zeigt signifikante Verbesserungen der Docking Power für SFCscore. Für die beste SFCscore-Funktion (SFCscore::frag) werden Steigerungen der Erfolgsraten für das Auffinden einer kristallnahen Pose unter den drei am besten bewerteten Docking-Lösungen von 61.4 % auf 86.9 % erzielt, was an die Docking Power der bis dato besten Scoringfunktionen aus der Literatur (z. B. DSX, GlideScore::SP) heranreicht (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). Die „Clash“-Filterfunktion allein ist auch der Kombination der „Clash“- und der „vnaHB“-Filterfunktion überlegen.
Ein weiterer Schwerpunkt der vorliegenden Arbeit wurde auf die Einbeziehung von Decoy-Daten (Struktur- und Affinitätsdaten schwach affiner und inaktiver Liganden) im Zuge der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gelegt. Dadurch soll eine adäquate Berücksichtigung ungünstiger Beiträge zur Bindungsaffinität ermöglicht werden, die für die Richtigkeit und Zuverlässigkeit ermittelter Vorhersagen essentiell ist. In der vorliegenden Arbeit wurden binäre Klassifizierungsmodelle zur Bewertung von Docking-Lösungen entwickelt, die die Einbeziehung von Decoy-Daten ohne die Verfügbarkeit von Affinitätsdaten erlauben. Der Random-Forest-Algorithmus (RF), SFCscore-Deskriptoren, der neu entwickelte „Clash“-Deskriptor, und die Decoy-Datensätze von Cheng und Huang (Trainingsdaten) bilden die Grundlage des leistungsfähigsten Klassifizierungsmodells. Der praktische Nutzen des „besten“ RF-Modells wurde nach Kombination mit der Scoringfunktion DSX anhand der Docking Power für das Auffinden einer kristallnahen Pose auf Rang 1 am unabhängigen Cheng-/Huang- (Komplexe, die nicht in den Trainingsdaten enthalten sind) und CSAR-2012-Testdatensatz untersucht. Gegenüber einer alleinigen Anwendung von DSX werden an beiden Testdatensätzen weitere Verbesserungen der Docking Power erzielt (Cheng-/Huang-Testdatensatz: DSX 84.24 %, RF 87.27 %; CSAR-2012-Testdatensatz: DSX 87.93 %, RF 91.38 %). Das „beste“ Modell zeichnet sich durch die zuverlässige Vorhersage richtig-positiver Docking-Lösungen für einige wenige Komplexe aus, für die DSX keine kristallnahe Ligandkonformation identifizieren kann. Ein visueller Vergleich der jeweils am besten bewerteten RF- und DSX-Pose für diese Komplexe zeigt Vorteile des RF-Modells hinsichtlich der Erkennung für die Protein-Ligand-Bindung essentieller Wechselwirkungen. Die Untersuchung der Bedeutung einzelner SFCscore-Deskriptoren für die Klassifizierung von Docking-Lösungen sowie die Analyse der Misserfolge nach Anwendung des Modells geben wertvolle Hinweise zur weiteren Optimierung der bestehenden Methode. Hinsichtlich der zu bewertenden Eigenschaften ausgeglichenere Trainingsdaten, Weiterentwicklungen bestehender SFCscore-Deskriptoren sowie die Implementierung neuer Deskriptoren zur Beschreibung bis dato nicht-berücksichtigter Beiträge zur Bindungsaffinität stellen Ansatzpunkte zur Verbesserung dar.
Der zweite Teil der vorliegenden Arbeit umfasst die Anwendung dockingbasierter Methoden im Rahmen der Entwicklung neuer Inhibitoren des „Macrophage Infectivity Potentiator“-(MIP)-Proteins von Legionella pneumophila und Burkholderia pseudomallei.
Das MIP-Protein von Legionella pneumophila stellt einen wichtigen Virulenzfaktor und daher ein attraktives Zielprotein für die Therapie der Legionellose dar. Im Rahmen der vorliegenden Arbeit erfolgten systematische Optimierungen des Pipecolinsäure-Sulfonamides 1, des bis dato besten niedermolekularen MIP-Inhibitors (IC50 (1): 9 ± 0.7 µM). Nach Hot-Spot-Analysen der Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Die Ergebnisse der Hot-Spot-Analysen zeigen günstige Wechselwirkungsbereiche für Donorgruppen und hydrophobe Substituenten in meta-Position sowie Akzeptorgruppen in para-Position des Benzylringes von 1 auf. Die Einführung einer Nitrofunktion in para-Position des Benzylringes von 1 (2h) resultiert in einer erhöhten MIP-Inhibition (IC50 (2h): 5 ± 1.5 µM), was wahrscheinlich auf die Ausbildung einer zusätzlichen Wasserstoffbrücke zu Gly116 zurückzuführen ist. Selektivitätsverbesserungen gegenüber dem strukturverwandten humanen FKBP12-Protein werden insbesondere für das para-Aminoderivat von 1 (2n) erzielt (Selektivitätsindex (1): 45, Selektivitätsindex (2n): 4.2; mit Selektivitätsindex = IC50 (MIP)/IC50 (FKBP12)). Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring (2s) führt zu einer verbesserten Löslichkeit bei vergleichbarer MIP-Inhibition.
Das MIP-Protein von Burkholderia pseudomallei spielt eine wichtige Rolle in der Pathogenese der Melioidose und stellt daher ein attraktives Zielprotein für die Entwicklung neuer Arzneistoffe dar. In der vorliegenden Arbeit erfolgten Optimierungen des bis dato besten niedermolekularen MIP-Inhibitors 1. Ausgehend von einem Strukturvergleich von Burkholderia pseudomallei MIP mit Legionella pneumophila MIP und einer Hot-Spot-Analyse der Burkholderia pseudomallei MIP-Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Der Strukturvergleich zeigt eine hohe Homologie beider Bindetaschen. Größere konformelle Änderungen werden lediglich für den von Ala94, Gly95, Val97 und Ile98 geformten Bindetaschenbereich beobachtet, was unterschiedliche Optimierungsstrategien für 1 erforderlich macht. Günstige Wechselwirkungsbereiche der Burkholderia pseudomallei MIP-Bindetasche finden sich einerseits für Donorgruppen oder hydrophobe Substituenten in para-Position des Benzylringes (Region A) von 1, andererseits für Akzeptor- bzw. Donorgruppen in para- bzw. meta-/para-Position des Trimethoxyphenylringes (Region B). Anhand von Docking-Studien konnten sowohl für Variationen in Region A als auch in Region B aussichtsreiche Kandidaten identifiziert werden. Initiale MIP-Inhibitionsmessungen der bis dato synthetisierten Derivate deuten auf erhöhte Hemmungen im Vergleich zu 1 hin. Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring führt auch hier zu vergleichbarer MIP-Inhibition bei verbesserter Löslichkeit. Derzeit sind weitere Synthesen und Testungen aussichtsreicher Liganden durch die Kooperationspartner geplant. Die Ergebnisse der Inhibitionsmessungen sollen deren Nutzen als MIP-Inhibitoren aufzeigen und wertvolle Informationen für weitere Zyklen des strukturbasierten Wirkstoffdesigns liefern. / Docking-based approaches belong to important virtual screening components and aim at predicting both the ligand position and conformation within the protein binding site as well as the binding affinity. To date scoring functions are still not fully reliable in correctly identifying near-native ligand conformations generated by docking. Thus, the first part of the current work is dedicated to the development of computer-aided methods for the evaluation of docking poses.
A first project focused on considering the saturation of hydrogen bond acceptors (HBA) and donors (HBD) for the evaluation of docking poses. Since structural and affinity data are missing, current scoring functions neglect unpaired buried HBA and HBD, which strongly disfavour high-affinity binding. Based on a detailed frequency analysis of unpaired buried HBA and HBD within high-quality protein-ligand complexes of the Hartshorn dataset, an empirical filter function (“vnaHB” filter function) was developed to remove unfavourable ligand binding poses prior to the ranking with scoring functions. The practical benefit of the filter function was investigated for the scoring functions SFCscore and DSX using pre-generated docking poses of the Cheng dataset. As shown in the frequency analysis, the saturation of buried polar groups is of utmost importance for high-affinity binding, as unpaired buried HBA and HBD are extremely rare. A complete saturation by proper protein counterparts is observed for about 48 % of all complexes under study, whereas approximately 92 % have less than three, mostly weak unpaired buried HBA or HBD (e.g. ether functions). Including also the saturation by water molecules reveals that actually for about 61 % of all complexes every hydrogen bonding group is saturated. Unlike DSX, the application of the filter function with SFCscore results in higher success rates for identifying a near-native 2.0 Å pose under the top scored poses, a criterion termed “Docking Power”. For the best SFCscore function (SFCscore::229m) the Docking Power with respect to the top three poses increases from 63.1 % to 64.2 %.
A further project focused on considering repulsive intermolecular contacts due to sterical overlap of the protein-ligand binding partners for the evaluation of docking poses. Although an inclusion of such repulsive contacts in scoring is of utmost importance for the identification of protein-bound ligand conformations, it remains challenging because of missing structural and affinity data. Based on the Lennard-Jones potential of the AMBER force field a new descriptor accounting for repulsive protein-ligand contacts (“clash” descriptor) was developed and used for analysing the frequency of unfavourable protein-ligand contacts among high-quality structures of the Hartshorn dataset. An empirical filter function (“clash” filter function) derived from the frequency distribution was applied to pre-generated docking poses of the Cheng dataset to remove unfavourable ligand binding poses prior to the ranking with SFCscore and DSX. As shown in the frequency analysis, mostly weakly repulsive contacts occur within protein-ligand complexes. For 75 % of the complexes of the Hartshorn dataset repulsive potentials of less than 0.462 kcal/mol are observed. Indeed, unfavourable contributions add up to not more than 0.8 kcal/mol to 2.5 kcal/mol per complex for 50 % of all structures; values in this range may be attributed to inaccuracies of crystal structures or could be counterbalanced by favourable protein-ligand interactions. The application of the “clash” filter function shows significant improvements of the Docking Power of SFCscore. For the best SFCscore function (SFCscore::frag) the success rates for identifying a near-native 2.0 Å pose under the three top scored poses increases from 61.4 % to 86.9 %, which is comparable to the Docking Power of the best scoring functions (e.g. DSX, GlideScore::SP) currently available in literature (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). The “clash” filter function alone is also superior to the combination of the “clash” and the “vnaHB” filter function.
Another focus of the work was the inclusion of decoy data (structure and affinity data of weakly active and inactive ligands) in scoring function development. Thus, unfavourable contributions to the binding affinity should be adequately considered, which appears essential for improving accuracy and reliability of the predictions. Within the scope of this work a binary classification model was developed for the evaluation of docking poses, allowing the inclusion of decoy poses without affinity data. The random forest algorithm (RF), SFCscore descriptors, the new “clash” descriptor, and the decoy datasets of Cheng and Huang (training data) provide the basis of the best-performing model. The practical benefit of the “best” RF model was investigated after combination with the scoring function DSX based on the Docking Power for identifying a near-native pose on rank 1 using the independent Cheng/Huang (only complexes not used for training) and the CSAR-2012 dataset. With respect to the standalone application of DSX, improvements of the Docking Power regarding both test sets are achieved (Cheng/Huang test set: DSX 84.24 %, RF 87.27 %; CSAR-2012 test set: DSX 87.93 %, RF 91.38 %). A key feature of the “best” model are reliable predictions of true positive docking poses for those complexes for which DSX fails to identify a near-native ligand conformation. A visual comparison of the best RF and DSX pose highlights advantages of the RF model regarding the recognition of interactions crucial for protein-ligand binding. The importance analysis of SFCscore descriptors for the classification of docking poses as well as the investigation of failures after model application provide useful hints for further improvements. Thus, more property-balanced training data, the further development of established SFCscore descriptors, and the implementation of new descriptors accounting for neglected contributions to the binding affinity constitute possible starting points for future improvements.
The second part of this work is dedicated to the application of docking-based methods for the development of new inhibitors of the "`Macrophage Infectivity Potentiator"'-(MIP) proteins of Legionella pneumophila and Burkholderia pseudomallei.
The MIP protein of Legionella pneumophila constitutes an important virulence factor and thus an attractive target for the treatment of legionellosis. Within the scope of this work the pipecolic acid sulfonamide 1, one of the best small-molecule MIP inhibitors to date (IC50 (1): 9 ± 0.7 µM), was systematically optimised. After hot spot analysis of the binding pocket, docking studies were conducted to select promising candidates for synthesis and testing MIP inhibition. The results of the hot spot analysis show favourable interaction fields for donor groups and hydrophobic substituents in meta position as well as acceptor groups in para position of the benzyl ring of 1. Introducing a nitro function in para position of the benzyl ring of 1 (2h) results in an increased MIP inhibition (IC50 (2h): 5 ± 1.5 µM), which is likely due to the formation of an additional hydrogen bond to Gly116. An improvement in the selectivity compared to the structurally related human FKBP12 protein is achieved particularly with the para amino derivative of 1 (2n) (selectivity index (1): 45, selectivity index (2n): 4.2, where the selectivity index = IC50 (MIP)/IC50 (FKBP12)). Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (2s) leads to improved solubility and comparable MIP inhibition.
The MIP protein of Burkholderia pseudomallei plays an important role in the pathogenesis of melioidosis and thus constitutes an attractive target for the development of new drugs against this disease. Within the scope of this work the currently best small-molecule MIP inhibitor 1 was optimised. Starting with a structural comparison of Burkholderia pseudomallei MIP and Legionella pneumophila MIP, as well as a hot spot analysis of the Burkholderia pseudomallei MIP binding pocket, docking studies were conducted to select promising candidates for synthesis and testing for MIP inhibition. The structural comparison reveals a high homology of the two binding pockets. Major conformational changes are observed for the binding pocket region formed by Ala94, Gly95, Val97 and Ile98, which necessitates different optimisation strategies for 1. Favourable interaction fields for the Burkholderia pseudomallei MIP binding pocket are found for donor groups or hydrophobic substituents in para position of the benzyl ring (region A) of 1 as well as for acceptor or donor groups in para or meta/para position of the trimethoxyphenyl ring (region B). On the basis of the docking studies promising candidates could be identified for variations in both regions. Initial MIP inhibition measurements of synthesised derivatives indicate increased inhibition compared to 1. Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (yielding a more soluble derivative) leads again to comparable MIP inhibition. Further syntheses and tests of promising ligands are currently being planned by the collaboration partners. The results of the inhibition measurements should demonstrate their suitability as MIP inhibitors and provide useful information for future structure-based drug design cycles.
Identifer | oai:union.ndltd.org:uni-wuerzburg.de/oai:opus.bibliothek.uni-wuerzburg.de:10158 |
Date | January 2014 |
Creators | Hein, Michael |
Source Sets | University of Würzburg |
Language | deu |
Detected Language | German |
Type | doctoralthesis, doc-type:doctoralThesis |
Format | application/pdf |
Rights | https://opus.bibliothek.uni-wuerzburg.de/doku/lic_ohne_pod.php, info:eu-repo/semantics/openAccess |
Page generated in 0.0099 seconds