Return to search

Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas / Development and implementation of a coarse-grained model for protein structure prediction

Made available in DSpace on 2015-03-04T18:57:49Z (GMT). No. of bitstreams: 1
GOLIATT_PVZC_thesis.pdf: 13370494 bytes, checksum: 2621901d59798613ae8fdb2d938dda20 (MD5)
Previous issue date: 2011-06-27 / The knowledge of the three-dimensional (3D) conformation of the native structure of proteins has assisted biotechnological researches as those focused on protein design and structure based drug design. As an alternative to the techniques of experimental prediction and theoretical prediction via comparative modeling, the theoretical prediction via ab initio technique has been increasingly exploited.

In the ab initio technique, the 3D protein structure prediction (PSP) is performed based only on its amino acid sequence and in their physicochemical properties. However, to obtain solutions that represent native structures, methods of ab initio PSP require a large number of function evaluations which limits their use in studies of more complex proteins. In the CG model, the representation of each amino acid is reduced to a set of few interaction sites, significantly reducing the number of degrees of freedom to be treated, and thus reducing the computational cost needed to evaluate each structure during the optimization process.

In this work, we developed and implemented a CG model applied to the PSP problem, including the ability to simulate the presence of disulfide bonds. This model was adapted to the GAPF program (Genetic Algorithm for Protein Folding), previously developed by the "Grupo de Modelagem Molecular de Sistemas Biológicos" (GMMSB/ LNCC) and originally implemented for the PSP via ab initio technique using an all-atom model representation.

The CG model has been tested on a set of 36 structures with sizes ranging from 18 to 106 amino acid residues, and covering the different classes of proteins (i.e. mainly alpha, alpha+beta and mainly beta). The results showed that the CG model proposed promoted improvements in predictive ability of GAPF program, now being able to predict β-sheet structures, and a decrease of approximately 80% of computational time. / O conhecimento da conformação tridimensional (3D) da estrutura nativa de uma proteína tem auxiliado pesquisas biotecnológicas como as voltadas à engenharia de proteínas e ao desenho racional de fármacos. Como alternativa às técnicas de predição experimental e à técnica de predição teórica via modelagem comparativa, a técnica de predição teórica via ab initio tem sido cada vez mais explorada.

Na técnica ab initio, a predição da estrutura 3D de uma proteína (PSP) é feita baseando-se apenas na sua sequência de resíduos de aminoácidos e nas propriedades físico-químicas dos mesmos. Entretanto, os métodos de PSP ab initio, para chegarem à soluções que representem estruturas nativas, requerem um grande número de avaliações de função o que limita suas aplicações em estudos de proteínas mais complexas.

Uma possível solução para este problema é o uso de uma representação simplificada do sistema (modelo coarse-grained - CG). No modelo CG, a representação de cada aminoácido é reduzida a um conjunto de poucos sítios de interação, diminuindo significativamente o número de graus de liberdade a serem tratados e, portanto, reduzindo o custo computacional necessário na avaliação de cada estrutura durante o processo de otimização.

Neste trabalho, foi desenvolvido e implementado um modelo CG aplicado ao problema de predição de estruturas 3D de proteínas, incluindo-se a possibilidade de simular a presença de ligações dissulfídicas. Este modelo foi adaptado ao programa GAPF (Genetic Algorithm for Protein Folding), previamente desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos (GMMSB/ LNCC) e originalmente implementado para a PSP via técnica ab initio usando um modelo de representação de todos os átomos do sistema.

O modelo CG desenvolvido foi testado em um conjunto de 36 estruturas, de tamanhos variando entre 18 e 106 resíduos de aminoácidos, e abrangendo as distintas classes de proteínas (i.e. preferencialmente alfa, alfa+beta e preferencialmente beta). Os resultados obtidos mostraram que o modelo CG proposto resultou em melhorias na capacidade preditiva do programa GAPF, sendo agora capaz de predizer conformações em folha-β, e na redução de aproximadamente 80% do tempo computacional.

Identiferoai:union.ndltd.org:IBICT/oai:tede-server.lncc.br:tede/157
Date27 June 2011
CreatorsGoliatt, Priscila Vanessa Zabala Capriles
ContributorsDardenne, Laurent E., Garratt, Richard Charles, Barbosa, Helio José Corrêa, Silva, Fernando Luís Barroso da
PublisherLaboratório Nacional de Computação Científica, Programa de Pós-Graduação em Modelagem Computacional, LNCC, BR, Serviço de Análise e Apoio a Formação de Recursos Humanos
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds