Encontrar a estrutura de uma proteína arbitrária é vital para a compreensão da funcionalidade desta proteína. Muitos modelos foram desenvolvidos para a predição em primeiros princípios, entre eles modelos de grades. Em modelos de grades, cada aminoácido ocupa uma posição da grade, com aminoácidos consecutivos ocupando posições adjacentes. Uma possível conformação da proteína é dada por um caminho nesta grade. Em uma grade, temos várias formas de codificar computacionalmente uma seqüência de aminoácidos. O método mais usado é o de coordenadas internas, mas também encontramos na literatura codificações por coordenadas cartesianas e ângulos de torção. Neste trabalho, introduzimos uma nova codificação dos dados para modelos de grades. Nesta codificação, uma proteína com n aminoácidos é configurada como uma seqüência numérica, com valores variando entre 0 e no caso bidimensional e e no caso tridimensional. Nesta grade, os possíveis movimentos para cada aminoácido são intuitivos e correspondem a somar e subtrair 1 e n no caso bidimensional e , e no caso tridimensional. Para exemplificarmos o desenvolvimento desta nova codificação, desenvolvemos um algoritmo genético específico para o problema de predição da estrutura da proteína (PSP). Analisamos o desenvolvimento deste algoritmo em quatro modelos, , , e , e realizamos testes com proteínas encontradas na literatura e no Protein Data Bank. / Finding the structure of an arbitrary protein is vital for the understanding of its functionality. Many models had been developed for the ab initio prediction, and the lattice model is one of these models. Lattice models specify that each amino acid occupies a lattice position, consecutive amino acids occupy adjacent positions and a protein conformation is given by a path in this lattice. We have some forms to codify an amino acid sequence computationally. The main method is the usage of internal coordinates, however we can find in literature codifications using cartesian coordinates and torsion angles. We introduce a new codification of the data for lattice models, in which a protein with amino acids is configured as a numerical sequence in a three-dimensional lattice of size and all the possible movements for each amino acid are intuitive and correspond to add and to subtract , and . With the goal of exemplifying the development of this new codification, we construct a specific genetic algorithm for the protein structure prediction (PSP) problem. We analyze the development of this algorithm in four models, , , e , and tests using found proteins in literature and in the Protein Data Bank are carried out.
Identifer | oai:union.ndltd.org:IBICT/oai:agregador.ibict.br.BDTD_LNCC:oai:lncc.br:70 |
Date | 13 May 2008 |
Creators | Luciana Rocha Pedro |
Contributors | Laurent Emmanuel Dardenne, Fernanda Maria Pereira Raupp, Nelson Francisco Favilla Ebecken, Ricardo Hiroshi Caldeira Takahashi, Helio José Corrêa Barbosa |
Publisher | Laboratório Nacional de Computação Científica |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf, application/pdf, application/pdf, application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0032 seconds