Made available in DSpace on 2015-04-14T14:50:06Z (GMT). No. of bitstreams: 1
451616.pdf: 18264447 bytes, checksum: 02e74b31d71030af5f9b0355ff4fef90 (MD5)
Previous issue date: 2013-03-15 / There currently are approximately 16 million of unique (non-redundant) protein sequences in
the GenBank. In the PDB, we can only find about 89,000 three-dimensional (3-D) protein
structures and only 1,393 different SCOP protein folds. Thus, there is a huge gap between our
ability to generate protein sequences and that of solving 3-D structures of proteins with
unique, novel folds. This gap has been reduced with the aid from structural bioinformatics by
addressing the problem of how a protein reaches its 3-D structure starting only from its amino
acid sequence. This is called the protein structure prediction (PSP) problem.
Thermodynamics considerations presented by Christian Anfinsen and co-workers in 1973
have it that a protein native structure is the one that minimizes its global free energy. Hence,
we can treat the PSP problem as a minimization one within an NP-complete class of
computation complexity. Several techniques have been used to predict the 3-D structure of
proteins. In this work we supplement these techniques by adding artificial intelligence
concepts still not much exploited in bioinformatics. More specifically, we propose a
framework, based on an ab initio approach, of a cooperative hierarquical multi-agent system
guided by a Simulated Annealing and a Monte Carlo scheme to address the PSP problem.
Our multi-agent system has as input the protein amino acid sequence. Amino acids are
represented by two agents: The C-Alpha agent (in lieu of the C alpha carbon atom) and the CBeta
agent (in lieu of the side chain centroid). These Amino Acid agents can interact with
each other. There are two other agents: one coordinates the Amino Acid agents; the other
coordinates the protein system. The multi-agent system was created using the NetLogo
platform. A clustering protocol was implemented for obtaining each simulation representant
model. The results were compared with published papers regarding similar methodology and
the use of Multi-Agent Systems to address the Protein Structure Prediction Problem. We
present partial results which are encouraging for mini proteins. / Atualmente existem aproximadamente 16 milh?es de sequ?ncias ?nicas de prote?nas
(n?o redundantes) no GenBank. Entretanto, no PDB, podemos encontrar apenas cerca de
85.000 estruturas tridimensionais (3D) de prote?nas das quais apenas 1.393 possuem
dobramento SCOP diferentes. Existe ent?o uma grande lacuna entre nossas atuais habilidades
no que se trata de gerar sequ?ncias de prote?nas e nossas habilidades em resolver estruturas
3D de prote?nas com novos dobramentos. Essa lacuna vem sendo reduzida com a ajuda da
bioinform?tica estrutural por meio do endere?amento do problema de como uma prote?na
alcan?a sua estrutura 3D partindo-se apenas de sua sequencia de amino?cidos. Esse ?
conhecido como o Problema PSP, do ingl?s Protein Structure Prediction Problem.
Considera??es termodin?micas apresentadas por Christian Anfinsen e colaboradores em 1973
deram inicio a uma forma de abordar o problema que hoje ? conhecida como a hip?tese de
Anfinsen, a qual afirma que a estrutura nativa de uma prote?na ? aquela que minimiza sua
energia global livre. Podemos ent?o, tratar o problema PSP como um problema de
minimiza??o, tendo em mente ser um problema de complexidade NP-Completo. Neste s?o
utilizados conceitos adventos da intelig?ncia artificial at? hoje n?o muito explorados na
bioinform?tica. Mais especificamente, propomos um arcabou?o baseado em uma abordagem
ab initio, envolvendo um sistema multi-agente hierarquicamente cooperativo e guiado por um
esquema baseado no m?todo de Monte Carlo e de Arrefecimento Simulado, a fim de obter-se
a otimiza??o de uma fun??o de energia. O sistema multi-agente tem como entrada apenas a
sequencia de amino?cidos das prote?nas. Cada amino?cido ? representado por dois agentes: O
agente C-Alfa (correspondendo o ?tomo C alfa) e um agente C-Beta (correspondendo ao
centroide da cadeia lateral do amino?cido). Esses agentes amino?cidos interagem entre si.
Existem dois outros tipos de agentes: um coordena os agentes Amino?cidos (C-Alfa e CBeta)
e outro coordena o sistema por inteiro. O sistema multi-agente foi criado utilizando a
plataforma NetLogo. Um protocolo de clusteriza??o foi desenvolvido para a obten??o da
estrutura modelo de cada simula??o e os resultados foram comparados com a literatura no
que se trata de PSP e multi-agentes e se mostraram promissores.
Identifer | oai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5236 |
Date | 15 March 2013 |
Creators | Paes, Thiago Lipinski |
Contributors | Souza, Osmar Norberto de |
Publisher | Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS |
Rights | info:eu-repo/semantics/openAccess |
Relation | 1974996533081274470, 500, 600, 1946639708616176246 |
Page generated in 0.002 seconds