O uso de rede neural artificial MLP na predição de estruturas secundárias de proteínas

Made available in DSpace on 2014-06-11T19:22:54Z (GMT). No. of bitstreams: 0
Previous issue date: 2004-06-23Bitstream added on 2014-06-13T18:49:49Z : No. of bitstreams: 1
ferreira_fr_me_sjrp.pdf: 884938 bytes, checksum: cb71cfbd072d7a80c82fa5ec84776eea (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / A predição de estruturas secundárias e terciárias pode contribuir para elucidar o problema de enovelamento de proteínas. Para isso, métodos de Redes Neurais Artificiais (RNAs) e Algoritmos Genéticos são utilizados a fim de predizê-las, a partir de determinadas seqüências primárias de aminoácidos. Neste sentido, esta pesquisa visa à utilização de três níveis de RNAs. O primeiro nível é composto por um vetor de entrada representando a seqüência primaria dos aminoácidos, com uma dimensão de 22.n, onde n é o tamanho da janela compreendida entre 7 a 23. O segundo nível possui a implementação dos resultados da primeira rede. Por fim o terceiro nível é composto por um júri de decisão. As RNAs são treinadas no Simulador MATLAB 5.0, um software composto de vários recursos para a sua implementação (Neural Network Toolbox). As RNAs implementadas são do tipo Multi Layer Perceptron (MLP), que utilizam o algoritmo backpropagation (RPROP) e a função de treinamento trainrp. Os dados obtidos são comparados com os preditores 'The Predict Protein Server Default' (www.emblheidelberg.de/predictprotein/submit_def.html), 'The PSA Protein Structure Prediction Server' (http//bmerc-www.bu.edu/psa/request.html) e 'The PSIPRED Protein Structure Prediction Server' (http://bioinf.cs.ucl.ac.uk/psipred/), a fim de se obter um modelo de predição. / The prediction of (secondaray and tertiary) structures of proteins can contribute to elucidadate the protein-folding problem. In oder to predict these structures we used methods of Artificial Neural Network (ANN) and genetic algorithms starting from the primary sequences of amino acids. The present work is composed of 3 networks levels. The first level is composed of ANNs of an input vector representing a segment of primary amino acid sequence. Since the encoding scheme uses a local window into the sequence, the input vector is a 22.n dimensional vector where n is the number of positions in the window (between 7 and 23). The outputs of level 1 are the inputs of the second level ANNs. The third level is the jury decision. The ANNs were trained with the Simulator MATLAB 5.0, software with several tools for its implementation (Neural Network Toolbox). The implemented ANNs are Multi Layer Perceptron (MLP) kind, which use the backpropagation algorithms (RPROP) together with training function trainrp. The obtained date are compared with the predictors 'The Predict Protein Server Default' (www.emblheidelberg.de/predictprotein/submit_def.html), 'The PSA Protein Structure Prediction Server' (http//bmerc-www.bu.edu/psa/request.html) e 'The PSIPRED Protein Structure Prediction Server' (http://bioinf.cs.ucl.ac.uk/psipred/) in order to heve an idea of the quality of the prediction.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unesp.br:11449/87507
Date23 June 2004
CreatorsFerreira, Fausto Roberto [UNESP]
ContributorsUniversidade Estadual Paulista (UNESP), Chahine, Jorge [UNESP], Ruggiero, José Roberto [UNESP], Scott, Luís Paulo Barbour [UNESP]
PublisherUniversidade Estadual Paulista (UNESP)
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format83 f. : il.
SourceAleph, reponame:Repositório Institucional da UNESP, instname:Universidade Estadual Paulista, instacron:UNESP
Rightsinfo:eu-repo/semantics/openAccess
Relation-1, -1, -1, -1

Page generated in 0.0026 seconds