Este trabalho propõe a utilização da técnica de computação evolucionária conhecida como algoritmos genéticos (AGs) na predição da estrutura de proteínas para o modelo 2D HP. A metodologia tem como principal proposta a utilização uma função de fitness melhorada, que utiliza o conceito de raio de giração. Operadores genéticos especiais foram desenvolvidos e acrescentados aos comumente usados em AG, além de novas estratégias utilizadas para auxiliar o algoritmo no processo de busca de conformações de proteínas. Estas modificações levaram ao desenvolvimento de um sistema de software com diversos recursos gráficos e apresentação de relatórios dos resultados, denominado GANDALF PRED. Uma certa quantidade de experimentos foi realizada com o objetivo de avaliar a influência parâmetros do AG no resultado obtido. Foram realizados dois conjuntos de testes para avaliar a metodologia proposta. O primeiro utilizou 9 seqüências de resíduos, manualmente definidas, cujos máximos de ligações são conhecidos e comprimento variando de 20 a 85 resíduos. Os resultados obtidos foram comparados com duas outras implementações encontradas na literatura. No segundo, 7 proteínas com características globulares foram escolhidas do PDB e traduzidas para o modelo HP. Seus comprimentos variam de 288 a 842 resíduos. Seus resultados foram apresentados e discutidos, já que nenhuma comparação pôde ser realizada. Para ambos os casos de teste, as conformações encontradas podem ser consideradas bons dobramentos. / This work suggests the use of an evolutionary computation technique known as genetic algorithms (GAs) for predicting protein structures in the 2D HP model. The methodology has the main proposal the use of an enhanced fitness function, which makes use of the radius of gyration concept. Special genetic operators were developed and added to those commonly used in GAs, besides new strategies to aid the algorithm in the search of protein conformations. These changes led to the development of a user-friendly software system, with several graphical resources and result reports, named GANDALF PRED. A certain amount of experiments were done with the objective of evaluating the influence of GA parameters in the result obtained. Two test cases were set to evaluate the proposed methodology. The first used 9 manually defined chains whose maximum number of hydrophobic non-local bonds is known a priori and length varying from 20 to 85 residues. The results were compared to two other implementations available in the literature. In the second, 7 proteins with globular traits were taken from PDB and translated to the HP model. Their lengths vary from 288 to 842 residues. The results were presented and discussed, since no comparison could be done. For both test cases, the conformations found can be considered good folds.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.utfpr.edu.br:1/112 |
Date | 2010 October 1914 |
Creators | Scapin, Marcos Paulo |
Contributors | Lopes, Heitor Silvério |
Publisher | Centro Federal de Educação Tecnológica do Paraná, Curitiba, Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 2, 96 MB |
Source | reponame:Repositório Institucional da UTFPR, instname:Universidade Tecnológica Federal do Paraná, instacron:UTFPR |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0026 seconds