Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas / Generalized Simulated Annealing Parameter Sweeping Applied to the Protein Folding Problem

Made available in DSpace on 2015-03-04T18:51:09Z (GMT). No. of bitstreams: 1
TeseFlavia.pdf: 12428230 bytes, checksum: 6fb8e9ea53da0aa51093c702fb32bc4a (MD5)
Previous issue date: 2009-06-06 / Coordenacao de Aperfeicoamento de Pessoal de Nivel Superior / As the genome sequencing advances, the comprehension of protein structures becomes a crucial extension to these progresses. In spite of the numerous recent technological advances, experimental determination of protein terciary structures is still very slow compared to the accumulated data from amino acid sequences. That is what makes the protein folding a central problem to the development of the pots-genomic era.

In this work we use an optimization method, the Generalized Simulated Annealing (GSA), which is based on Tsallis' generalized thermostatistics, to investigate the protein folding problem. Although GSA is a generic procedure, its efficiency depends not only on the appropriate choice of parameters, but also on topological characteristics of the energy hypersurface. By mapping all the GSA parameters, it can be possible to reduce the number of possible choices of them. That also allows an analysis of its effects on the algorithm behavior.

As a initial step, we apply GSA to known structures, such as polyalanines. In sequence, we also apply GSA to three more peptides of ribosomal P proteins, which are of considerable importance on the comprehension of Chagas' heart disease. Each one contains 13 amino
acids and differ only on the third residue by a non-conservative mutation. As these peptides do not have experimentally resolved structure, we analyze results obtained from GSA followed by Molecular Dynamics simulations. Validity of these results is studied such that, in the future, unknown structures can be determined by this technique with a higher degree of confidence. / Com os rápidos avanços no seqüenciamento do genoma, a compreensão da estrutura de proteínas torna-se uma extensão crucial a esses progressos. Apesar dos significativos avanços tecnológicos recentes, a determinação experimental da estrutura terciária de proteínas ainda é muito lenta se comparada com a taxa de acúmulo de dados das seqüências de aminoácidos. Isto torna o enovelamento de proteínas um problema central para o desenvolvimento da biologia pós-genômica.

Em nosso trabalho, fazemos uso de um método de otimização, o Generalized Simulated Annealing (GSA), baseado na termoestatística generalizada por Tsallis. Embora o GSA seja um procedimento geral, sua eficiência depende não apenas da escolha apropriada de parâmetros, mas também das características topológicas da hiper--superfície de energia da função custo. Com o mapeamento dos parâmetros necessários à aplicação do GSA, pode-se reduzir
significativamente o número de escolhas, além de tornar possível uma análise do efeito dos parâmetros no comportamento do algoritmo.

Como passo inicial, usamos estruturas conhecidas, com as quais os resultados obtidos com o GSA possam ser comparados, como é o caso das polialaninas. Além disso, aplicamos, o GSA a três peptídeos de proteínas ribossomais da família P, de considerável importância no estudo da doença de Chagas. Cada um possui 13 aminoácidos, diferindo em apenas uma mutação não conservativa no terceiro aminoácido. Como os peptídeos não possuem estrutura
experimentalmente resolvida, analisamos os resultados obtidos com GSA seguidos por simulações de Dinâmica Molecular. A validade destes resultados é estudada, de forma que, no futuro, estruturas desconhecidas possam ser determinadas com certo grau de confiabilidade.

Identiferoai:union.ndltd.org:IBICT/oai:tede-server.lncc.br:tede/105
Date06 June 2009
CreatorsAgostini, Flavia Paiva
ContributorsPascutti, Pedro Geraldo, Dardenne, Laurent Emmanuel, Simões, Renato, Caffarena, Ernesto Raúl, Caliri, Antonio
PublisherLaboratório Nacional de Computação Científica, Programa de Pós-Graduação em Modelagem Computacional, LNCC, BR, Serviço de Análise e Apoio a Formação de Recursos Humanos
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds