Return to search

Implementação e análise de modelos de solvatação para a predição ab initio de estruturas de proteínas / Implementation and analysis of solvation models for ab initio prediction of protein structures

Made available in DSpace on 2015-03-04T18:57:48Z (GMT). No. of bitstreams: 1
Dissertacao_Corrigida_Final_Gregorio_2011.pdf: 7241946 bytes, checksum: cb82d524114ee5f3199d1239571fb2cd (MD5)
Previous issue date: 2011-12-09 / The problem of predicting the native structure of proteins from their amino acid sequence is one of the major challenges of computational biology and implies very high computational cost. Several attempts have been made in the search for efficient algorithms and simplified models for protein structure prediction. In this respect, the inclusion and the correct description of the effects of protein solvent interaction are essential for the success of these methods, considering that the solvent plays a key role in the folding process and structural stability of proteins.
Despite recent progress, the modelling of protein-solvent interactions in computer simulations remains a challenge. Implicit solvation models use different strategies to reproduce the effects of the solvent without representing their molecules discretely, doing this with a direct estimate of the solvation free energy.
This work aimed to implement and carry out a comparative analysis of implicit solvation models described in the literature, and evaluate the impact of such models in the predictive capacity of the GAPF protein structure prediction suite ( Genetic Algorithms for Protein Folding ), developed in our research group GMMSB/LNCC. As some of the solvation models require the value of solvent accessible surface area (SASA) in their calculations, it was also necessary to implement a method that unites accuracy and computational efficiency.
The methodology used in the POPS program was implemented for the calculation of the SASA, and the program MSMS is used as a reference for validation. Four solvation models were analyzed: EAS, I-SOLV, EEF1 e GBobc (used as reference). The thermal unfolding of 15 proteins via molecular dynamics (using the GROMACS simulation package) was carried out to evaluate the solvation models before these were placed in the context of a program for protein structure prediction. Seeking to evaluate the impact of each solvation model on
GAPF, large scale tests on the ab initio prediction of structures of a set of 24
proteins were performed.
The results show that: (i) the use of the POPS methodology is a good alternative for calculating the SASA; (ii) the solvation models I-SOLV, EEF1 and GBobc reflect the behavior of the SASA in their solvation free energies; (iii) with the exception of EAS, all the models were able to discriminate folding from unfolding structures; (iv) no model was able to discriminate close to native structures from structures with similar compression but with high RMSD (folded incorrectly); (v) the I-SOLV and EEF1 were the solvation models that came
closest to the reference model GBobc; (vi) the solvation models I-SOLV and EEF1 provided an improvement in RMSD of predicted structures in the program GAPF with respect to experimental structures; (vii) the I-SOLV and EAS have the lowest computational cost among the evaluated solvation models, being faster than GBobc.
The solvation models I-SOLV and EEF1 are the best alternative among those studied to model the effects of the solvation in the protein structure prediction. / O problema da predição da estrutura nativa de proteínas a partir da sua seqüência de aminoácidos é um dos grandes desafios da biologia computacional e implica em altíssimo custo computacional. Várias tentativas vêm sendo realizadas na busca de algoritmos e de modelos simplificados e eficientes para a predição de estruturas de proteínas. Nesse sentido, a inclusão e a correta descrição dos efeitos das interações entre a proteína e o solvente são essenciais para o sucesso desses métodos, haja vista que o solvente tem um papel fundamental no processo de enovelamento e estabilidade estrutural das proteínas. Apesar dos recentes progressos, a modelagem da interação proteína-solvente em simulações computacionais ainda é um desafio. Os modelos implícitos de solvatação utilizam diferentes estratégias para reproduzir os efeitos do solvente sem representar de forma discreta suas moléculas, e o fazem através de uma estimativa direta da energia livre de solvatação.
O objetivo geral deste trabalho foi implementar e realizar uma análise comparativa de modelos implícitos de solvatação descritos na literatura, além de avaliar o impacto de tais modelos na capacidade preditiva do programa de predição ab initio de estruturas de proteínas GAPF, desenvolvido no GMMSB/LNCC. Como alguns modelos de solvatação requerem o valor da área de superfície acessível ao solvente (SASA) em seus cálculos, tornou-se também necessário, a implementação de um método que atrele acurácia e eficiência computacional.
A metodologia utilizada no programa POPS foi implementada para o cálculo da SASA e o programa MSMS foi usado como referência para a validação da mesma. Quatro modelos de solvatação foram analisados: EAS, I-SOLV, EEF1 e GBobc (usado como referência). O desenovelamento térmico de 15 proteínas via dinâmica molecular (utilizando o pacote de simulação GROMACS) foi realizado com o objetivo de avaliar os modelos de solvatação antes desses serem inseridos no contexto de um programa de predição de estrutura de proteínas. Buscando apreciar o impacto de cada modelo de solvatação no programa GAPF, foram realizados testes em larga escala para a predição ab initio de estruturas de um
conjunto de 24 proteínas.
Os resultados obtidos mostram que: (i) o uso da metodologia do POPS apresenta-se como uma boa alternativa para o cálculo da SASA; (ii) os modelos de solvatação I-SOLV, EEF1 e GBobc refletem o comportamento da SASA nas suas energias livres de solvatação; (iii) com exceção do EAS, os demais modelos se mostram capazes de discriminar estruturas enoveladas de estruturas desenoveladas; (iv) nenhum dos modelos foi capaz de discriminar de forma satisfatória estruturas enoveladas de estruturas com compactação similar e alto
RMSD (enoveladas incorretamente); (v) os modelos I-SOLV e EEF1 foram os que
mais se aproximaram do modelo de referência GBobc; (vi) os modelos de solvatação I-SOLV e EEF1 proporcionaram uma melhora no RMSD das estruturas preditas no programa GAPF em relação às estruturas experimentais; (vii) o ISOLV e o EAS apresentam o menor custo computacional dentre os modelos de solvatação avaliados, sendo mais rápidos que o GBobc. Os modelos de solvatação ISOLV e EEF1 apresentam-se como as melhores alternativas, dentre as estudadas, para a modelagem dos efeitos da solvatação na predição de estrutura de proteínas.

Identiferoai:union.ndltd.org:IBICT/oai:tede-server.lncc.br:tede/156
Date09 December 2011
CreatorsRocha, Gregório Kappaun
ContributorsDardenne, Laurent E., Custódio, Fábio Lima, Barbosa, Helio José Corrêa, Pascutti, Pedro Geraldo
PublisherLaboratório Nacional de Computação Cientifica, Programa de Pós-Graduação em Modelagem Computacional, LNCC, BR, Serviço de Análise e Apoio a Formação de Recursos Humanos
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds