Made available in DSpace on 2015-03-04T18:51:02Z (GMT). No. of bitstreams: 1
thesis_final.pdf: 17163181 bytes, checksum: 00c96f156953680b2cfcf263393486b2 (MD5)
Previous issue date: 2008-04-30 / Conselho Nacional de Desenvolvimento Cientifico e Tecnologico / The goal of ab initio protein structure prediction (PSP) methods is to predict, based on first principles, the three-dimensional structure that a given amino-acid sequence will assume. These methods have important biotechnological applications from the creation of new proteins, drug design (the receptor's structure), the refinement of theoretical models and the elucidation of structures from sparse experimental data. The prediction encompasses an optimization problem with thousands of degrees of freedom and is associated with extremely complex energy hypersurfaces. This results in a problem that is difficult to treat computationally.
In this work a simplified three-dimensional protein model (hydrophobic-polar model, HP) was used in order to reduce the computational costs of the PSP problem allowing for the fast development of a robust and efficient genetic algorithms based methodology. This methodology was then adapted to an all-atoms protein model. During the development different strategies for the PSP problem were analyzed. A new crowding based approach is described for the maintenance of diversity within the population which resulted in achieving multiple solutions.
The HP model's methodology was tested against all 35 major sequences from the literature and the comparative results showed that the proposed genetic algorithm is superior to other evolutionary algorithms and comparable to specialized methods. The algorithm applied to the all-atoms model was initially tested with poli-alanines and later with five other proteins. Structures with RMSDs ranging from 2.0 to 6.7 Å were found and the proposed algorithm was superior to others similar methods, in terms of computational costs.
The results obtained showed that optimization strategies with multiple solutions characteristics present two advantages. The first one is the more efficient investigation of a complex hypersurface, with better chances of finding optimal solutions; the second one is increasing the probability of finding structures close to those experimentally determined, even when they are not near the global optimum of the energy hypersurface. / Métodos de predição ab initio de estrutura de proteínas (PSP) buscam prever, baseando-se em primeiros princípios, a estrutura tridimensional que uma dada seqüência de aminoácidos irá adotar no espaço. Os métodos de predição ab initio atualmente possuem aplicações biotecnológicas que envolvem desde a criação de novas proteínas, o auxílio no desenho racional de fármacos (estrutura do receptor), o refinamento de modelos teóricos e a obtenção de estruturas a partir de dados experimentais incompletos. Entretanto, a predição envolve um problema de otimização que lida com milhares de graus de liberdade e está associado à hipersuperfícies de energia extremamente complexas o que torna o problema difícil de ser tratado computacionalmente.
Neste trabalho utilizamos um modelo tridimensional de proteínas simplificado (modelo hidrofóbico-polar, HP) para reduzir os custos computacionais associados ao problema de PSP de modo que uma metodologia de otimização, robusta e eficiente, baseada em algoritmos genéticos, fosse desenvolvida mais rapidamente. Em seguida a metodologia foi adaptada para um modelo com descrição atômica que utiliza um campo de forças clássico como função de energia. Durante o desenvolvimento foram implementadas e analisadas várias estratégias para o problema. Foi descrita uma nova abordagem, baseada em crowding, para a manutenção da diversidade na população que resulta na obtenção simultânea de múltiplas soluções.
A metodologia para o modelo HP foi aplicada a 35 seqüências disponíveis na literatura e os resultados comparativos mostraram que o algoritmo genético desenvolvido é superior a outros algoritmos evolutivos publicados, e comparável a métodos especializados. A metodologia para o modelo atômico foi inicialmente testada em poli-alaninas e em seguida em cinco outras proteínas de maior complexidade. Foram encontradas estruturas apresentando RMSDs entre 2,0 e 6,7 Å, em relação à estrutura determinada experimentalmente. O algoritmo genético se mostrou superior a outros métodos semelhantes, em termos de custo computacional.
Os resultados obtidos mostram que as estratégias de otimização envolvendo a busca por múltiplos mínimos possuem duas grandes vantagens. A primeira delas está em uma investigação mais efetiva de uma hipersuperfície complexa aumentando a probabilidade de se encontrar soluções ótimas (de mais baixa energia); a segunda delas está no aumento da probabilidade de se obter estruturas próximas daquelas determinadas experimentalmente mesmo quando estas não são o mínimo global da hipersuperfície de energia investigada.
Identifer | oai:union.ndltd.org:IBICT/oai:tede-server.lncc.br:tede/89 |
Date | 30 April 2008 |
Creators | Custódio, Fábio Lima |
Contributors | Dardenne, Laurent Emmanuel, Barbosa, Helio José Corrêa, Galeão, Augusto Cesar Noronha Rodrigues, Borges, Carlos Cristiano H., Raupp, Fernanda Maria Pereira, Bisch, Paulo Mascarello, Garratt, Richard Charles |
Publisher | Laboratório Nacional de Computação Científica, Programa de Pós-Graduação em Modelagem Computacional, LNCC, BR, Serviço de Análise e Apoio a Formação de Recursos Humanos |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds