Spelling suggestions: "subject:"estruturas dde proteínas"" "subject:"estruturas dee proteínas""
1 |
Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas / Knowledge-based Approach to Genetic Algorithms for the Protein Structure Prediction ProblemOliveira, Lariza Laura de 20 May 2011 (has links)
Proteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG. / Proteins exhibit an enormous variety of biology functions. The knowledge of tertiary structures can help the understanding of the proteins function. According to Anfisen, the native tertiary structure of a protein can be determined by its primary structure information, what could allow that computational methods could be used to predict the tertiary structure when the primary structure is available. However, there is still not a computational tool to solve the structure prediction problem for a large range of proteins. In this way, Protein Structure Prediction (PSP) has been a challenge to Molecular Biology. The conformation of native protein is usually the thermodynamically most stable configuration, i.e., the one having the lowest free energy. Hence, PSP can be viewed as a problem of optimization, where the structure with the lowest free energy should be found among all possible structures. However, this is an NP-problem, where traditional optimization methods, in general, do not have good performance. Genetic algorithms (GAs), due to their characteristics, are interesting for this class of problems. In recent years, there is a growing interest in using GAs for the protein structure prediction problem. The main objective of this work is to verify the addition of useful information to GAs employed in PSP. Each individual of the GA represents a solution for the optimization problem which is, in this case, a possible conformation that will be evaluated by a force field function. Thus, an individual is encoded by a set of torsion angles of each amino acid. In order to reduce the search space, a database composed of angles, determined by crystallography and NMR, is used. With the aim to guide the final search process and maintain diversity in GAs, two strategies were employed here: Random Immigrants and Similarity-based Immigrants. The last strategy was based on similarity of primary amino acid sequence. Furthermore, in this work, a coarse-grained force field, which uses -carbon to represent the protein backbone was employed to evaluate the individuals of GA.
|
2 |
Uma nova representação para o problema da estrutura de proteínas em grades / A new representation for the problem of prediction of the protein structure in latticesPedro, Luciana Rocha 13 May 2008 (has links)
Made available in DSpace on 2015-03-04T18:51:08Z (GMT). No. of bitstreams: 1
Dissertacao Luciana1.pdf: 6052653 bytes, checksum: 9c7348d9ada9fa32dce1bedcfa34e110 (MD5)
Previous issue date: 2008-05-13 / Fundação Carlos Chagas Filho de Amparo a Pesquisa do Estado do Rio de Janeiro / Finding the structure of an arbitrary protein is vital for the understanding of its functionality. Many models had been developed for the ab initio prediction, and the lattice model is one of these models. Lattice models specify that each amino acid occupies a lattice position, consecutive amino acids occupy adjacent positions and a protein conformation is given by a path in this lattice. We have some forms to codify an amino acid sequence computationally. The main method is the usage of internal coordinates, however we can find in literature codifications using cartesian coordinates and torsion angles. We introduce a new codification of the data for lattice models, in which a protein with amino acids is configured as a numerical sequence in a three-dimensional lattice of size and all the possible movements for each amino acid are intuitive and correspond to add and to subtract , and . With the goal of exemplifying the development of this new codification, we construct a specific genetic algorithm for the protein structure prediction (PSP) problem. We analyze the development of this algorithm in four models, , , e , and tests using found proteins in literature and in the Protein Data Bank are carried out. / Encontrar a estrutura de uma proteína arbitrária é vital para a compreensão da funcionalidade desta proteína. Muitos modelos foram desenvolvidos para a predição em primeiros princípios, entre eles modelos de grades. Em modelos de grades, cada aminoácido ocupa uma posição da grade, com aminoácidos consecutivos ocupando posições adjacentes. Uma possível conformação da proteína é dada por um caminho nesta grade. Em uma grade, temos várias formas de codificar computacionalmente uma seqüência de aminoácidos. O método mais usado é o de coordenadas internas, mas também encontramos na literatura codificações por coordenadas cartesianas e ângulos de torção. Neste trabalho, introduzimos uma nova codificação dos dados para modelos de grades. Nesta codificação, uma proteína com n aminoácidos é configurada como uma seqüência numérica, com valores variando entre 0 e no caso bidimensional e e no caso tridimensional. Nesta grade, os possíveis movimentos para cada aminoácido são intuitivos e correspondem a somar e subtrair 1 e n no caso bidimensional e , e no caso tridimensional. Para exemplificarmos o desenvolvimento desta nova codificação, desenvolvemos um algoritmo genético específico para o problema de predição da estrutura da proteína (PSP). Analisamos o desenvolvimento deste algoritmo em quatro modelos, , , e , e realizamos testes com proteínas encontradas na literatura e no Protein Data Bank.
|
3 |
Função de avaliação dinâmica em algoritmos genéticos aplicados na predição de estruturas tridimensionais de proteínas / Genetic Algorithms with Dynamic Fitness Functions Applied to Tridimensional Protein Structure PredictionLuís Henrique Uchida Ishivatari 28 September 2012 (has links)
O problema de predição de estruturas tridimensionais de proteínas pode ser visto computacionalmente como um problema de otimização, tal que dada a sequência de aminoácidos, deve-se encontrar a estrutura tridimensional da proteína dentre as muitas possíveis através da obtenção de mínimos de funções de energia. Vários pesquisadores têm proposto estratégias de Computação Evolutiva para a determinação de estruturas tridimensionais das proteínas, entretanto nem sempre resultados animadores têm sido alcançados visto que entre outros fatores, há um grande número de ótimos locais no espaço de busca. Geralmente as funções de fitness empregadas pelos algoritmos de otimização são baseadas em campos de força com diferentes termos de energia, sendo que os parâmetros destes termos são ajustados a priori e são mantidos estáticos ao longo do processo de otimização. Alguns pesquisadores sugerem que o uso de funções de fitness dinâmicas, ou seja, que mudam durante um processo de otimização evolutivo, pode aumentar a capacidade das populações fugirem de ótimos locais em problemas altamente multimodais. Neste trabalho, propõe-se que os parâmetros dos termos do campo de força utilizado sejam modificados durante o processo de otimização realizado por Algoritmos Genéticos (AGs) no problema de predição de estruturas de proteínas, sendo aumentados ou diminuídos, por exemplo, de acordo com a sua influência na formação de estruturas secundárias e no seu ajuste fino. Como a função de avaliação será modificada durante o processo de otimização, a predição de estruturas tridimensionais de proteínas torna-se um problema de otimização dinâmica, sendo que o uso de Algoritmos Genéticos específicos para tais problemas, como o AG com hipermutação e os AGs com imigrantes aleatórios são investigados aqui. É proposta uma nova métrica relacionada ao alinhamento da estrutura secundária da proteína, para auxiliar a análise dos dados obtidos e os resultados dos experimentos indicam que os algoritmos com função de avaliação dinâmica obtiveram resultados melhores que os algoritmos estáticos, o que é explicado pelo fato de as mudanças na função de fitness possibilitarem eventuais fugas de ótimos locais, bem como um aumento da diversidade da população. / The protein structure prediction can be seen as an optimization problem where given an amino acid sequence, the tertiary protein structure must be found amongst many possible by obtaining energy functions minima. Many researchers have been proposing Evolutionary Computation strategies to find tridimensional structures of proteins; however results are not always satisfactory since among other factors, there are always a great number of local optima in the search space. Usually, the fitness functions used by optimization algorithms are based on force fields with different energy terms with parameters from those terms being adjusted a priori, kept static through the optimization process. Some researchers suggest that the use of dynamic functions, i.e., that can be changed during the evolutionary process, can help the population to escape from local optima in highly multimodal problems. In this work we propose that the force field parameters can be changed during the optimization process of Genetic Algorithms (GAs) in the protein structure prediction problem, being increased or decreased, for instance, according with its influence on formation of secondary structures and its fine tuning. Since the cost function will be changed during the optimization process, the protein tridimensional structure prediction becomes a dynamic optimization problem and specific Genetic Algorithms for this kind of problem, like the hypermutation GA and random immigrants GA are investigated. We also propose a new metric related to the proteins secondary structure alignment to help the analysis of obtained data. Results indicate that the dynamic function algorithms obtained better results than static algorithms since changes on the fitness function allow the population to escape local optima, as well as an increase on the population diversity.
|
4 |
Função de avaliação dinâmica em algoritmos genéticos aplicados na predição de estruturas tridimensionais de proteínas / Genetic Algorithms with Dynamic Fitness Functions Applied to Tridimensional Protein Structure PredictionIshivatari, Luís Henrique Uchida 28 September 2012 (has links)
O problema de predição de estruturas tridimensionais de proteínas pode ser visto computacionalmente como um problema de otimização, tal que dada a sequência de aminoácidos, deve-se encontrar a estrutura tridimensional da proteína dentre as muitas possíveis através da obtenção de mínimos de funções de energia. Vários pesquisadores têm proposto estratégias de Computação Evolutiva para a determinação de estruturas tridimensionais das proteínas, entretanto nem sempre resultados animadores têm sido alcançados visto que entre outros fatores, há um grande número de ótimos locais no espaço de busca. Geralmente as funções de fitness empregadas pelos algoritmos de otimização são baseadas em campos de força com diferentes termos de energia, sendo que os parâmetros destes termos são ajustados a priori e são mantidos estáticos ao longo do processo de otimização. Alguns pesquisadores sugerem que o uso de funções de fitness dinâmicas, ou seja, que mudam durante um processo de otimização evolutivo, pode aumentar a capacidade das populações fugirem de ótimos locais em problemas altamente multimodais. Neste trabalho, propõe-se que os parâmetros dos termos do campo de força utilizado sejam modificados durante o processo de otimização realizado por Algoritmos Genéticos (AGs) no problema de predição de estruturas de proteínas, sendo aumentados ou diminuídos, por exemplo, de acordo com a sua influência na formação de estruturas secundárias e no seu ajuste fino. Como a função de avaliação será modificada durante o processo de otimização, a predição de estruturas tridimensionais de proteínas torna-se um problema de otimização dinâmica, sendo que o uso de Algoritmos Genéticos específicos para tais problemas, como o AG com hipermutação e os AGs com imigrantes aleatórios são investigados aqui. É proposta uma nova métrica relacionada ao alinhamento da estrutura secundária da proteína, para auxiliar a análise dos dados obtidos e os resultados dos experimentos indicam que os algoritmos com função de avaliação dinâmica obtiveram resultados melhores que os algoritmos estáticos, o que é explicado pelo fato de as mudanças na função de fitness possibilitarem eventuais fugas de ótimos locais, bem como um aumento da diversidade da população. / The protein structure prediction can be seen as an optimization problem where given an amino acid sequence, the tertiary protein structure must be found amongst many possible by obtaining energy functions minima. Many researchers have been proposing Evolutionary Computation strategies to find tridimensional structures of proteins; however results are not always satisfactory since among other factors, there are always a great number of local optima in the search space. Usually, the fitness functions used by optimization algorithms are based on force fields with different energy terms with parameters from those terms being adjusted a priori, kept static through the optimization process. Some researchers suggest that the use of dynamic functions, i.e., that can be changed during the evolutionary process, can help the population to escape from local optima in highly multimodal problems. In this work we propose that the force field parameters can be changed during the optimization process of Genetic Algorithms (GAs) in the protein structure prediction problem, being increased or decreased, for instance, according with its influence on formation of secondary structures and its fine tuning. Since the cost function will be changed during the optimization process, the protein tridimensional structure prediction becomes a dynamic optimization problem and specific Genetic Algorithms for this kind of problem, like the hypermutation GA and random immigrants GA are investigated. We also propose a new metric related to the proteins secondary structure alignment to help the analysis of obtained data. Results indicate that the dynamic function algorithms obtained better results than static algorithms since changes on the fitness function allow the population to escape local optima, as well as an increase on the population diversity.
|
5 |
Uma nova representação para o problema da estrutura de proteínas em grades / A new representation for the problem of prediction of the protein structure in latticesLuciana Rocha Pedro 13 May 2008 (has links)
Encontrar a estrutura de uma proteína arbitrária é vital para a compreensão da funcionalidade desta proteína. Muitos modelos foram desenvolvidos para a predição em primeiros princípios, entre eles modelos de grades. Em modelos de grades, cada aminoácido ocupa uma posição da grade, com aminoácidos consecutivos ocupando posições adjacentes. Uma possível conformação da proteína é dada por um caminho nesta grade. Em uma grade, temos várias formas de codificar computacionalmente uma seqüência de aminoácidos. O método mais usado é o de coordenadas internas, mas também encontramos na literatura codificações por coordenadas cartesianas e ângulos de torção. Neste trabalho, introduzimos uma nova codificação dos dados para modelos de grades. Nesta codificação, uma proteína com n aminoácidos é configurada como uma seqüência numérica, com valores variando entre 0 e no caso bidimensional e e no caso tridimensional. Nesta grade, os possíveis movimentos para cada aminoácido são intuitivos e correspondem a somar e subtrair 1 e n no caso bidimensional e , e no caso tridimensional. Para exemplificarmos o desenvolvimento desta nova codificação, desenvolvemos um algoritmo genético específico para o problema de predição da estrutura da proteína (PSP). Analisamos o desenvolvimento deste algoritmo em quatro modelos, , , e , e realizamos testes com proteínas encontradas na literatura e no Protein Data Bank. / Finding the structure of an arbitrary protein is vital for the understanding of its functionality. Many models had been developed for the ab initio prediction, and the lattice model is one of these models. Lattice models specify that each amino acid occupies a lattice position, consecutive amino acids occupy adjacent positions and a protein conformation is given by a path in this lattice. We have some forms to codify an amino acid sequence computationally. The main method is the usage of internal coordinates, however we can find in literature codifications using cartesian coordinates and torsion angles. We introduce a new codification of the data for lattice models, in which a protein with amino acids is configured as a numerical sequence in a three-dimensional lattice of size and all the possible movements for each amino acid are intuitive and correspond to add and to subtract , and . With the goal of exemplifying the development of this new codification, we construct a specific genetic algorithm for the protein structure prediction (PSP) problem. We analyze the development of this algorithm in four models, , , e , and tests using found proteins in literature and in the Protein Data Bank are carried out.
|
6 |
Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas / Knowledge-based Approach to Genetic Algorithms for the Protein Structure Prediction ProblemLariza Laura de Oliveira 20 May 2011 (has links)
Proteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG. / Proteins exhibit an enormous variety of biology functions. The knowledge of tertiary structures can help the understanding of the proteins function. According to Anfisen, the native tertiary structure of a protein can be determined by its primary structure information, what could allow that computational methods could be used to predict the tertiary structure when the primary structure is available. However, there is still not a computational tool to solve the structure prediction problem for a large range of proteins. In this way, Protein Structure Prediction (PSP) has been a challenge to Molecular Biology. The conformation of native protein is usually the thermodynamically most stable configuration, i.e., the one having the lowest free energy. Hence, PSP can be viewed as a problem of optimization, where the structure with the lowest free energy should be found among all possible structures. However, this is an NP-problem, where traditional optimization methods, in general, do not have good performance. Genetic algorithms (GAs), due to their characteristics, are interesting for this class of problems. In recent years, there is a growing interest in using GAs for the protein structure prediction problem. The main objective of this work is to verify the addition of useful information to GAs employed in PSP. Each individual of the GA represents a solution for the optimization problem which is, in this case, a possible conformation that will be evaluated by a force field function. Thus, an individual is encoded by a set of torsion angles of each amino acid. In order to reduce the search space, a database composed of angles, determined by crystallography and NMR, is used. With the aim to guide the final search process and maintain diversity in GAs, two strategies were employed here: Random Immigrants and Similarity-based Immigrants. The last strategy was based on similarity of primary amino acid sequence. Furthermore, in this work, a coarse-grained force field, which uses -carbon to represent the protein backbone was employed to evaluate the individuals of GA.
|
7 |
MDAPSP - Uma arquitetura modular distribuída para auxílio à predição de estruturas de proteínas / MDAPSP - A modular distributed architecture to support the protein structure predictionOliveira, Edvard Martins de 09 May 2018 (has links)
A predição de estruturas de proteínas é um campo de pesquisa que busca simular o enovelamento de cadeias de aminoácidos de forma a descobrir as funções das proteínas na natureza, um processo altamente dispendioso por meio de métodos in vivo. Inserida no contexto da Bioinformática, é uma das tarefas mais computacionalmente custosas e desafiadoras da atualidade. Devido à complexidade, muitas pesquisas se utilizam de gateways científicos para disponibilização de ferramentas de execução e análise desses experimentos, aliado ao uso de workflows científicos para organização de tarefas e disponibilização de informações. No entanto, esses gateways podem enfrentar gargalos de desempenho e falhas estruturais, produzindo resultados de baixa qualidade. Para atuar nesse contexto multifacetado e oferecer alternativas para algumas das limitações, esta tese propõe uma arquitetura modular baseada nos conceitos de Service Oriented Architecture (SOA) para oferta de recursos computacionais em gateways científicos, com foco nos experimentos de Protein Structure Prediction (PSP). A Arquitetura Modular Distribuída para auxílio à Predição de Estruturas de Proteínas (MDAPSP) é descrita conceitualmente e validada em um modelo de simulação computacional, no qual se pode identificar suas capacidades, detalhar o funcionamento de seus módulos e destacar seu potencial. A avaliação experimental demonstra a qualidade dos algoritmos propostos, ampliando a capacidade de atendimento de um gateway científico, reduzindo o tempo necessário para experimentos de predição e lançando as bases para o protótipo de uma arquitetura funcional. Os módulos desenvolvidos alcançam boa capacidade de otimização de experimentos de PSP em ambientes distribuídos e constituem uma novidade no modelo de provisionamento de recursos para gateways científicos. / PSP is a scientific process that simulates the folding of amino acid chains to discover the function of a protein in live organisms, considering that its an expensive process to be done by in vivo methods. PSP is a computationally demanding and challenging effort in the Bioinformatics stateof- the-art. Many works use scientific gateways to provide tools for execution and analysis of such experiments, along with scientific workflows to organize tasks and to share information. However, these gateways can suffer performance bottlenecks and structural failures, producing low quality results. With the goal of offering alternatives to some of the limitations and considering the complexity of the topics involved, this thesis proposes a modular architecture based on SOA concepts to provide computing resources to scientific gateways, with focus on PSP experiments. The Modular Distributed Architecture to support Protein Structure Prediction (MDAPSP) is described conceptually and validated in a computer simulation model that explain its capabilities, detail the modules operation and highlight its potential. The performance evaluation presents the quality of the proposed algorithms, a reduction of response time in PSP experiments and prove the benefits of the novel algorithms, establishing the basis for a prototype. The new modules can optmize the PSP experiments in distributed environments and are a innovation in the resource provisioning model for scientific gateways.
|
8 |
Aumento da eficiência do cálculo da energia de van der Waals em algoritmos genéticos para predição de estruturas de proteínas / Enhance the Van der Waals energy efficiency calculi in genetic algorithms for protein structure predictionBonetti, Daniel Rodrigo Ferraz 31 March 2010 (has links)
As proteínas são moléculas presentes nos seres vivos e essenciais para a vida deles. Para entender a função de uma proteína, devese conhecer sua estrutura tridimensional (o posicionamento correto de todos os seus átomos no espaço). A partir da estrutura de uma proteína vital de um organismo causador de uma doença é possível desenvolver fármacos para o tratamento da doença. Para encontrar a estrutura de uma proteína, métodos biofísicos, como Cristalografia de Raio-X e Ressonância Nuclear Magnética têm sido empregados. No entanto, o uso desses métodos tem restrições práticas que impedem a determinação de várias estruturas de proteínas. Para contornar essas limitações, métodos computacionais para o problema de predição da estrutura da proteína (PSP, Protein Structure Prediction) têm sido investigados. Várias classes de métodos computacionais têm sido desenvolvidas para o problema de PSP. Entre elas, as abordagens ab initio são muito importantes, pois não utilizam nenhuma informação prévia de outras estruturas de proteínas para fazer o PSP, apenas a sequência de aminoácidos da proteína e o gráfico de Ramachandran são empregados. O PSP ab initio é um problema combinatorial que envolve relativamente grandes instâncias na prática, por exemplo, as proteínas em geral têm centenas ou milhares de variáveis para determinar. Para vencer esse entrave, metaheurísticas como os Algoritmos Genéticos (AGs) têm sido investigados. As soluções geradas por um AG são avaliadas pelo cálculo da energia potencial da proteína. Entre elas, o cálculo da interação da energia de van der Waals é custoso computacionalmente tornando o processo evolutivo do AG muito lento mesmo para proteínas pequenas. Este trabalho investiga técnicas para reduzir significativamente o tempo de execução desse cálculo. Basicamente, foram propostas modificações de técnicas de paralelização utilizando MPI e OpenMP para os algoritmos resultantes. Os resultados mostram que o cálculo pode ser 1.500 vezes mais rápido para proteínas gigantes quando aplicadas as técnicas investigadas neste trabalho / Proteins are molecules present in the living organism and essential for their life. To understand the function of a protein, its threedimensional structure (the correct positions of all its atoms in the space) should be known. From the structure of a vital protein of an organism that causes a human disease, it is possible to develop medicines for treatment of the disease. To find a protein structure, biophysical methods, as Crystallography of X-Ray and Magnetic Nuclear Resonance, have been employed. However, the use of those methods have practical restrictions that impede the determination of several protein structures. Aiming to overcome such limitation, computational methods for the problem of protein structure prediction (PSP) has been investigated. Several classes of computational methods have been developed for PSP. Among them, ab initio approaches are very important since they use no previous information from other protein structure, only the sequence of amino acids of the protein and the Ramachandran graph are employed. The ab initio PSP is a combinatorial problem that involves relatively large instances in practice, i. e. proteins in general have hundreds or thousands of variables to be determined. To deal with such problem, metaheuristics as Genetic Algorithms (GAs) have been investigated. The solutions generated by a GA are evaluated by the calculus of the potencial energies of the protein. Among them, the calculation of the interaction of van der Waals energy is computationally intense making the evolutionary process of a GA very slow even for non-large proteins. This work investigated techniques to significantly reduce the running time for that calculus. Basically, we proposed modifications parallelization of the resultant algorithm using MPI and OpenMP techniques. The results show that such calculus can be 1.500 times faster when applying the techniques investigated in this work for large proteins
|
9 |
Algoritmo evolutivo de muitos objetivos para predição ab initio de estrutura de proteínas / Multiobjective evolutionary algorithm with many tables to ab initio protein structure predictionBrasil, Christiane Regina Soares 10 May 2012 (has links)
Este trabalho foca o desenvolvimento de algoritmos de otimização para o problema de PSP puramente ab initio. Algoritmos que melhor exploram o espaço de potencial de soluções podem, em geral, encontrar melhores soluções. Esses algoritmos podem beneficiar ambas abordagens de PSP, tanto o modelo ab initio quanto os baseados em conhecimento a priori. Pesquisadores tem mostrado que Algoritmos Evolutivos Multiobjetivo podem contribuir significativamente no contexto do problema de PSP puramente ab initio. Neste contexto, esta pesquisa investiga o Algoritmo Evolutivo Multiobjetivo baseado em Tabelas aplicado ao PSP puramente ab initio, que apresenta interessantes resultados para proteínas relativamente simples. Por exemplo, um desafio para o PSP puramente ab initio é a predição de estruturas com folhas-. Para trabalhar com tais proteínas, foi desenvolvido procedimentos computacionalmente eficientes para estimar energias de ligação de hidrogênio e solvatação. Em geral, estas não são consideradas no PSP por abordagens que combinam métodos de otimização e conhecimento a priori. Considerando somente van der Waals e eletrostática, as duas energias de interação que mais contribuem para a definição da estrutura de uma proteína, com as energias de ligação de hidrogênio e solvatação, o problema de PSP tem quatro objetivos. Problemas combinatórios (tais como o PSP), com mais de três objetivos, geralmente requerem métodos específicos capazes de lidar com muitos critérios. Para resolver essa limitação, este trabalho propõe um novo método para a otimização dos muitos objetivos, chamado Algoritmo Evolutivo Multiobjetivo com Muitas Tabelas (AEMMT). Esse método executa uma amostragem mais adequada do espaço de funções objetivo e, portanto, pode mapear melhor as regiões promissoras deste espaço. A capacidade de lidar com muitos objetivos capacita o AEMMT a utilizar melhor a informação oriunda das energias de solvatação e de ligação de hidrogênio, e então predizer estruturas com folhas- e algumas proteínas relativamente mais complexas. Do ponto de vista computacional, o AEMMT é um novo método que lida com muitos objetivos (mais de dez) encontrando soluções relevantes / This work focuses on the development of optimization algorithms for the purely ab initio Protein Structure Prediction (PSP) problem. Algorithms that better explore the space of potential solutions can in general find better solutions. Such algorithms can benefit both ab initio and template-based PSP, that uses priori knowledge. Researches have shown that Multiobjective evolutionary algorithms can contribute significantly in the context of purely ab initio PSP. In this context, this research investigates the Multiobjective Evolutionary Algorithm based on Tables applied to purely ab initio PSP, which has shown interesting results for relatively simple proteins. For example, one challenge for purely ab initio PSP is the prediction of structures with -sheets. To work with such proteins, this research has developed computationally efficient procedures to estimate hydrogen bond and solvation energies. In general, they are not considered by PSP approaches combining optimization methods with priori knowledge. Only by considering van der Waals and electrostatic, the two interaction energies that mostly contribute to defining a protein structure, and the hydrogen bond and solvation energies, the PSP problem has four objectives. Combinatorial problems (such as the PSP) with more than three objective usually require specific methods capable of dealing with many goals. To address this limitation, we propose a new method for many objective optimization, called Multiobjective Evolutionary Algorithm with Many Tables (MEAMT). This method performs a more adequate sampling of the space of objective functions and, therefore, can better map the promising regions of this space. The ability of dealing with many objectives enables the MEANT to better use information generated by solvation and hydrogen bond energies, and then predict structures with -sheets and some relatively complex proteins. From the computational point of view, the MEAMT is a new method for dealing with many objectives (more than ten) finding relevant solutions
|
10 |
Aumento da eficiência do cálculo da energia de van der Waals em algoritmos genéticos para predição de estruturas de proteínas / Enhance the Van der Waals energy efficiency calculi in genetic algorithms for protein structure predictionDaniel Rodrigo Ferraz Bonetti 31 March 2010 (has links)
As proteínas são moléculas presentes nos seres vivos e essenciais para a vida deles. Para entender a função de uma proteína, devese conhecer sua estrutura tridimensional (o posicionamento correto de todos os seus átomos no espaço). A partir da estrutura de uma proteína vital de um organismo causador de uma doença é possível desenvolver fármacos para o tratamento da doença. Para encontrar a estrutura de uma proteína, métodos biofísicos, como Cristalografia de Raio-X e Ressonância Nuclear Magnética têm sido empregados. No entanto, o uso desses métodos tem restrições práticas que impedem a determinação de várias estruturas de proteínas. Para contornar essas limitações, métodos computacionais para o problema de predição da estrutura da proteína (PSP, Protein Structure Prediction) têm sido investigados. Várias classes de métodos computacionais têm sido desenvolvidas para o problema de PSP. Entre elas, as abordagens ab initio são muito importantes, pois não utilizam nenhuma informação prévia de outras estruturas de proteínas para fazer o PSP, apenas a sequência de aminoácidos da proteína e o gráfico de Ramachandran são empregados. O PSP ab initio é um problema combinatorial que envolve relativamente grandes instâncias na prática, por exemplo, as proteínas em geral têm centenas ou milhares de variáveis para determinar. Para vencer esse entrave, metaheurísticas como os Algoritmos Genéticos (AGs) têm sido investigados. As soluções geradas por um AG são avaliadas pelo cálculo da energia potencial da proteína. Entre elas, o cálculo da interação da energia de van der Waals é custoso computacionalmente tornando o processo evolutivo do AG muito lento mesmo para proteínas pequenas. Este trabalho investiga técnicas para reduzir significativamente o tempo de execução desse cálculo. Basicamente, foram propostas modificações de técnicas de paralelização utilizando MPI e OpenMP para os algoritmos resultantes. Os resultados mostram que o cálculo pode ser 1.500 vezes mais rápido para proteínas gigantes quando aplicadas as técnicas investigadas neste trabalho / Proteins are molecules present in the living organism and essential for their life. To understand the function of a protein, its threedimensional structure (the correct positions of all its atoms in the space) should be known. From the structure of a vital protein of an organism that causes a human disease, it is possible to develop medicines for treatment of the disease. To find a protein structure, biophysical methods, as Crystallography of X-Ray and Magnetic Nuclear Resonance, have been employed. However, the use of those methods have practical restrictions that impede the determination of several protein structures. Aiming to overcome such limitation, computational methods for the problem of protein structure prediction (PSP) has been investigated. Several classes of computational methods have been developed for PSP. Among them, ab initio approaches are very important since they use no previous information from other protein structure, only the sequence of amino acids of the protein and the Ramachandran graph are employed. The ab initio PSP is a combinatorial problem that involves relatively large instances in practice, i. e. proteins in general have hundreds or thousands of variables to be determined. To deal with such problem, metaheuristics as Genetic Algorithms (GAs) have been investigated. The solutions generated by a GA are evaluated by the calculus of the potencial energies of the protein. Among them, the calculation of the interaction of van der Waals energy is computationally intense making the evolutionary process of a GA very slow even for non-large proteins. This work investigated techniques to significantly reduce the running time for that calculus. Basically, we proposed modifications parallelization of the resultant algorithm using MPI and OpenMP techniques. The results show that such calculus can be 1.500 times faster when applying the techniques investigated in this work for large proteins
|
Page generated in 0.0997 seconds