Spelling suggestions: "subject:"[een] PREDICTION OF PROTEIN STRUCTURE"" "subject:"[enn] PREDICTION OF PROTEIN STRUCTURE""
1 |
[en] MULTIOBJETIVE GENETIC ALGORITHM FOR PREDICTING PROTEIN STRUCTURES IN HYDROPHOBIC – POLAR MODEL / [pt] ALGORITMO GENÉTICO MULTIOBJETIVO NA PREDIÇÃO DE ESTRUTURAS PROTEICAS NO MODELO HIDROFÓBICO - POLAREDWIN GERMAN MALDONADO TAVARA 07 October 2014 (has links)
[pt] O problema da predição das estruturas de proteínas (Protein Structure Prediction (PSP)) é um dos desafios mais importantes na biologia molecular. Pelo fato deste problema ser muito difícil, têm sido propostos diferentes modelos simplificados para resolvê-lo. Um dos mais estudados é o modelo, Hidrofóbico-Polar (HP), o modelo HP fornece uma estimativa da energia da proteína com base na soma de interações entre pares de aminoácidos hidrofóbicos (contatos H-H). Entretanto, apesar das simplificações feitas no modelo HP, o problema permanece complexo, pertencendo à classe NP-Difícil. Muitas técnicas têm sido propostas para resolver este problema entre elas, técnicas baseadas em algoritmos genéticos. Em muitos casos, as técnicas baseadas em AG foram usadas com sucesso, mas, no entanto, abordagens utilizando AG muitas vezes não tratam adequadamente as soluções geradas, prejudicando o desempenho da busca. Além disso, mesmo que eles, em alguns casos, consigam atingir o mínimo de energia conhecido para uma conformação, estes modelos não levam em conta a forma da proteína um fator muito importante na hora de obter proteínas mais compactas. Foi desenvolvido um algoritmo genético multiobjetivo para PSP no modelo HP, de modo de avaliar de forma mais eficiente, as conformações produzidas. O modelo utiliza como avaliação uma combinação baseada no número de colisões, número de contatos hidrofóbicos, compactação dos aminoácidos hidrofóbicos e hidrofílicos, obtendo, desta forma estruturas mais naturais e de mínima energia. Os resultados obtidos demonstram a eficiência desse algoritmo na obtenção de estruturas proteicas compactas providenciando indicadores da compactação dos aminoácidos hidrofóbicos e hidrofílicos da proteína. / [en] The problem of protein structured prediction (PSP) is one of the most important challenges in molecular biology. Because this problem is very difficult, different simplified models have been proposed to solve it. One of the most studied is the Hydrophobic-Polar model HP this model provides an estimate of the protein energy based on the sum of hydrophobic contacts. However, despite the simplifications made in the HP model, the problem remains complex, belonging to the class of NP-Hard problems. Many techniques have been proposed to solve this problem as genetic algorithms. In many cases the GA techniques have been used successfully, but, however, with GA approaches often do not adequately address the generated solutions, impairing the performance of the search. Furthermore, in some cases would attain the minimum energy for a known conformation, these models do not take care the protein shape, a very important factor to obtain more compact proteins. This work developed a multiobjective genetic algorithm to PSP in HP model evaluating more efficiently, the conformations produced. This model is a combination of assessment based on the collisions numbers, hydrophobic contacts, hydrophobic and hydrophilic core compression, obtaining thus more natural structures with minimum energy. The results demonstrate the efficiency of this algorithm to obtain protein structures indicators providing compact compression of the hydrophobic and hydrophilic core protein.
|
2 |
Desenvolvimento de metodologias para predição de estruturas de proteínas independente de moldes / Development of free-modeling methodologies for protein structure predictionRocha, Gregório Kappaun 17 September 2015 (has links)
Submitted by Maria Cristina (library@lncc.br) on 2015-10-13T18:53:31Z
No. of bitstreams: 1
Tese_Gregorio_LNCC_Set_2015_FINAL.pdf: 24967973 bytes, checksum: 0efd2d2481063521b74d53264c4be5bb (MD5) / Approved for entry into archive by Maria Cristina (library@lncc.br) on 2015-10-13T18:53:44Z (GMT) No. of bitstreams: 1
Tese_Gregorio_LNCC_Set_2015_FINAL.pdf: 24967973 bytes, checksum: 0efd2d2481063521b74d53264c4be5bb (MD5) / Made available in DSpace on 2015-10-13T18:53:59Z (GMT). No. of bitstreams: 1
Tese_Gregorio_LNCC_Set_2015_FINAL.pdf: 24967973 bytes, checksum: 0efd2d2481063521b74d53264c4be5bb (MD5)
Previous issue date: 2015-09-17 / Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do Rio de Janeiro / The protein structure prediciton problem (PSP) consists of discovering the native three-dimensional arrangement of a protein molecule using the information stored in its amino acid sequence. Unveiling the 3D structure of a protein is a way to obtain crucial information about its functions, given that the function of a protein is intrinsically related to its native three-dimensional structure. The experimental determination of the protein structure presents some technical difficulties and is also costly in workload and time. Thus, the investment in computational methods for PSP becomes imminent. This thesis has as main objective to increase the predictive ability of the GAPF protein structure prediction program and contribute to the advancement of theories and methodologies in the free-modeling prediction area. Efforts are directed on two fronts: (i) Improve the modeling of the energy function by the development and Implementing new potential for modeling the problem. (ii) To Increase the conformational search through the development and implementation of a multi-objective genetic algorithm. For the modeling of the problem, they were inserted in the function cost new ad hoc potentials that deal with hydrophobic compactation and with hydrogen bonds, key components in protein folding. For conformational search, a multiobjective steady-state genetic algorithm with phenotypic crowding was proposed. The new methodology was evaluated in a test set of 46 proteins, of all classes, and compared to consolidated methods in the literature, such as quark. The contributions of this thesis provided a major advance in the GAPF's predictive power, increasing the quality of the models and allowing investments in longer sequences. Advances have been notable in beta-sheets predictions, mainly due to the inclusion of hydrogen bonding potentials. Were made available also interesting tools for the future development of the program and GAPF was put as a good candidate for free-modeling predictions against prominent methodologies in the area. / O problema da predição de estrutura de proteínas (PSP) consiste em desvendar o arranjo tridimensional da molécula a partir de sua sequência de aminoácidos. Conhecer a estrutura das proteínas constituintes de um sistema biológico é uma forma de se obter informações cruciais sobre o seu funcionamento, haja vista que a função de uma proteína está intrinsecamente relacionada à sua estrutura nativa tridimensional. A determinação experimental da estrutura de uma proteína além de apresentar dificuldades técnicas, é também dispendiosa em volume de trabalho e de tempo. Sendo assim, o investimento em métodos computacionais para PSP torna-se eminente. Essa tese tem como objetivo geral aumentar a capacidade preditiva do programa de predição de estrutura de proteínas GAPF e contribuir para o avanço das teorias e metodologias na área da predição independente de moldes (free-modeling). Os esforços são direcionados em duas frentes: (i) Melhorar a modelagem da função de energia, através do desenvolvimento e implementação de novos potenciais para a modelagem do problema. (ii) Incrementar a busca conformacional, através do desenvolvimento e implementação de um algoritmo genético multiobjetivo. Para a modelagem do problema, foram inseridos na função custo novos potenciais ad hoc que tratam da compactação hidrofóbica e das ligações de hidrogênio, componentes fundamentais no enovelamento protéico. Para a busca na superfície de energia, um algoritmo genético não-geracional multiobjetivo com crowding fenotípico foi proposto. A nova metodologia foi avaliada em um conjunto teste com 46 proteínas, de todas as classes, e comparada com métodos consolidados na literatura como o QUARK. As contribuições desta tese proporcionaram um grande avanço no poder preditivo do programa GAPF, aumentando a qualidade dos modelos e permitindo investir em sequências maiores. Avanços foram notáveis na predição de folhas-beta, principalmente fruto dos potenciais de ligação de hidrogênio inseridos. Disponibilizou-se, ainda, ferramentas interessantes para o desenvolvimento futuro do programa e colocou o GAPF como um bom candidato para predições independentes de molde frente metodologias de destaque na área.
|
Page generated in 0.2935 seconds