• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 27
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 565
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 42
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
271

Arquitetura neural para controle da locomoção de um robô quadrúpede baseada em referências biológicas / Neural Architecture for the Locomotion Control of a Quadruped Robot Based on Biological References

Basso, Daniel Monteiro January 2005 (has links)
A natureza é uma fonte inesgotável de soluções elegantes para os mais diversos problemas, da aparente simplicidade do formato do ovo, que garante maior segurança ao organismo em desenvolvimento, à evidente complexidade do sistema nervoso humano, que é capaz de pensar sobre problemas e encontrar soluções para eles. Neste trabalho foram aplicados modelos computacionais inspirados em estudos neurológicos para a realização da locomoção de um robô quadrúpede. O corpo do robô foi simulado, permitindo incorporar características mais semelhantes às de um animal do que seria possível com um robô de verdade, como grande quantidade de articulações e força dos motores. A arquitetura neural responsável pelo controle do robô teve como referência para seu desenvolvimento os Geradores Centrais de Padrões, que são circuitos neurais capazes de gerar a seqüência de ativações musculares envolvidas em diversos movimentos rítmicos, como respirar e caminhar, e estão em sua maioria localizados na medula espinhal. Para compor esta rede foi usado um modelo de neurônio com algumas propriedades encontradas em um neurônio real, como a capacidade de inibir a ativação de outros neurônios, e outras puramente matemáticas, tornando-o uma ferramenta versátil para incorporar a funcionalidade de outros modelos de neurônios e de redes neurais. Trabalhos futuros farão uso dos resultados desta pesquisa como base para abordar temas mais complexos, como planejamento motor e tomada de decisão. / Nature is an endless source of elegant solutions to every kind of problem, from the seeming simplicity of the egg’s shape, which assures a safer environment to the developing organism, to the evident complexity of the human nervous system, which is capable of thinking about problems and finding solutions to them. In this work some computational models inspired on neurological research were applied to achieve the locomotion of a quadruped robot. The robot’s body was simulated, allowing to have features more similar to their animal counterparts than would be possible using a real robot, such as the high amount of articulations and the motors’ strength. The neural architecture responsible for the robot’s control was developed using Central Pattern Generators as reference, which are neural circuits capable of generating the sequence of muscle activations involved in a variety of rhythmic movements, such as breathing and walking, and are mostly located in the spine. To assemble this network a neuron model was used which has some properties found on a real neuron, as the ability to inhibit other neurons’ activation, and others purely mathematical, making it a versatile tool to incorporate the functionality of other neuron and neural networks models. Future works will make use of these research’s results as a base to approach more complex problems, such as motor planning and decision making.
272

Um sistema baseado em agentes para re-anotação de genomas / An agent-based system for re-annotation of genomes

Nascimento, Leonardo Vianna do January 2005 (has links)
A análise da informação contida em seqüências genéticas tem ganho cada vez mais importância nos dias atuais. A chamada anotação genética tem o objetivo de, a partir de uma ou mais seqüências, determinar suas características estruturais e funcionais. Muitos processos de anotação já foram realizados com êxito aumentando consideravelmente nosso conhecimento acerca do mecanismo genético de diversos organismos. A re-anotação genética é um processo que visa revisar o resultado da anotação, em virtude da disponibilidade de novas informações. Neste trabalho foi desenvolvido um sistema de re-anotação automática, onde tarefas de análise repetitivas podem ser automatizadas e os dados na anotação re-analisados periodicamente, a fim de que possíveis modificações possam ser detectadas. O sistema é baseado na tecnologia de agentes. Cada agente é responsável pela execução de diferentes ferramentas de bioinformática. Ao final do processo, os resultados individuais são combinados a fim de atingir o objetivo da análise. O sistema demonstrou eficácia na análise realizada em organismos procariontes durante a fase de validação. Ambientes de re-anotação como este são ferramentas interessantes a serem futuramente integradas a sistemas de anotação existentes. / The analysis of the information present in genetic sequences is gaining more importance nowadays. The genetic annotation aims to determine structural and functional characteristics of the sequences. Many annotation processes have already been carried out, improving our knowledge about the genetic mechanism of several organisms. The genetic re-annotation is a process that aims to review the annotation results when new information is available. This work presents an automatic re-annotation system where repetitive analysis tasks can be automated and annotation data are periodically re-analysed in order to detect possible differences. The system is based on the agent technology and each agent must execute different bioinformatics tools and merge its results in order to reach the analysis goals. The system proved to be efficient on the analysis carried out in procariotic organisms in the validation process, becoming an interesting tool to be integrated in annotation systems in the future.
273

Modelagem e simulação de algoritmos paralelos baseados em operações com DNA / DNA-Based modelling and simulation of parallel algorithms

Cervo, Leonardo Vieira January 2002 (has links)
A área de biologia computacional está vivendo um crescimento rápido causado pela revolução no estudo de genômas e pelo avanço das técnicas de manipulação do material genético. Com essas novas tecnologias para manipulação de seqüências, a importância de achar uma solução eficiente para os problemas chamados de intratáveis também cresceu, pois muitos problemas envolvidos na análise de DNA pertencem a essa classe de problemas. Uma abordagem para achar essas soluções é usar o próprio DNA para realizar computação, aproveitando o paralelismo massivo utilizado em operações que manipulam seqüências de DNA. Isto é estudado na área de computação com DNA. Esse trabalho propõe um modelo formal para representar a estrutura da molécula de DNA e das operações que são realizadas com ela em laboratório. Este modelo ajuda a preencher a necessidade de uma descrição matemática que possa ser usada para analisar algoritmos baseados em DNA, assim como possibilitar a simulaç~o desses algoritmos em um computador. Foi utilizada a teoria de gramáticas de grafos, uma linguagem de especificação formal, para modelar as seqüências de DNA e suas I operações. O trabalho apresenta um estudo da estrutura da molécula de DNA, deScrevendo suas características e as principais operações que são realizadas para sua manipulação em laboratório. Uma descrição da teoria de Gramática de Grafos e sua aplicação também é apresentada. Para validação do modelo proposto as especificações resultantes foram adaptadas para o formato L-systems, outra linguagem de especificação formal, permitindo realizar a simulação da especificação no ambiente L-Studio. / The area of computational biology is living a fast growth, fed with a revolution in the study of genomes and with the advance in the techniques of genetic material manipulation. With these new technologies for manipulation of sequences, the relevance of finding efficient solution to the so-called computer intractable problems has also grown, because many problems involved in analyzing DNA belong to this class of problems. One approach to find such solutions is to use DNA itself to perform computations, taking advantage of the massive parallelism involved in operations that manipulate DNA sequences. This is what is studied in the area ofDNA computing. This work proposes a formal model to represent the DNA structure and the operations performed in laboratory with it. This model helps to fill the need of a mathematical description that can be used to analyze DNA-based algorithms, as well as for simulating such algorithms in a computer. We use graph grammars, a formal specification language, to model the DNA sequences and operations. The work presents a study of the DNA molecule structure, describing its features and the main operations performed for manipulation in laboratory. A description of the theory of Graph Grammars and its application are presented too. To validate the proposed model, the resulting DNA-graph grammar specifications are then translated into the L-systems format, another formal specification language, allowing for the simulation of the specifications using the L-Studio environment.
274

Formalização de uma linguagem visual para descrição de sistemas biológicos / Formalization of a visual language to specify biological pathways

Medrado, Ramon Gomes January 2009 (has links)
Vias biológicas representam interações entre entidades químicas complexas (proteínas, substratos, metabólitos etc.) que ocorrem no nível molecular das células. A representação e compreensão do comportamento destas vias é o principal alvo de estudos da Biologia Sistêmica. Esta área de estudos envolve a construção de modelos matemáticos que possam simular in silico (computacionalmente) o comportamento destes sistemas biológicos verificados in vivo (experimentalmente). Do ponto de vista computacional é evidente que tais sistemas são complexos para abordar e descrever de modo intuitivo. São necessários modelos com valor preditivo, isto é, que permitam descrever os comportamentos do sistema que são experimentalmente verificáveis. Algumas notações gráficas foram propostas para descrever vias biológicas. Entre elas, os diagramas de processos tem sido amplamente utilizados. Um diagrama de processos é essencialmente um grafo no qual vértices e arestas representam componentes biológicos, e há uma notação gráfica associada com cada elemento. Nesta dissertação propomos uma fundamentação formal para a linguagem dos diagramas de processos definindo a sintaxe usando gramática de grafos. Nós definimos primeiramente um grafo chamado BioProc, descrevendo o meta-modelo dos diagramas de processos. Instâncias do grafo BioProc são portanto diagramas de processos modelando vias biológicas. Para descrever a semântica foi proposta uma tradução algébrica dos grafos BioProc para redes de Petri estocásticas generalizadas (GSPNs) já amplamente utilizadas na modelagem de processos biológicos. O uso de gramática de grafos como formalismo intermediário na tradução habilita a verificação sintática da via com a checagem dos tipos válidos que podem ser definidos para cada reação antes da simulação na rede de Petri e usá-las posteriormente para explorar propriedades estruturais e estocásticas do modelo. Além disso serve como base para a evolução do modelo proposto. Isto é relevante já que modelos frequentemente são construídos incrementalmente para se adaptar a novos requisitos e/ou incluir novas características. / Biological pathways represent interactions between complex chemical entities (proteins, substrates, metabolites, etc.) that occur at the molecular level of cells. The representation and comprehension of biological pathways behavior is the main target of research in the field of Systems Biology. This area investigates the construction of mathematical models that can simulate in silico (computationally) the behavior of biological systems checked in vivo (experimentally). From a computational view point it is clear that such systems are too complex to analyze and describe in an intuitiveway. Models with predictive value are needed, describing the behaviors that are experimentally verifiable. There are some graphical notations to describe biological pathways. Among them, process diagrams have been widely used. A process diagram is essentially a graph in which vertices and edges represent biological components, and there is a graphical notation associated with each element. In this master thesis we give a formal foundation for biological process diagrams, by defining their (concrete and abstract) syntax and semantics using a formalism called graph grammars. We first build a graph called BioProc Graph, describing the meta-model of process diagrams. Instances of this BioProc graph are concrete process diagrams modeling biological pathways. To describe the semantics we proposed a translation of BioProc diagrams to generalized stochastic Petri networks (GSPNs) already widely used in modeling biological processes. The use of graph grammar formalism as a basis for translation enables the syntatic verification to check the valid types that can be defined for each reaction after the simulation of Petri net and before that to explore structural and stochastic properties of the model. In addition it serves as the basis for model evolution proposed. This is relevant because models are often built incrementally to adapt to new requirements and/or include new features.
275

Caracterização de sequências expressas do genoma café potencialmente relacionadas com a resistência a doenças / Caracterization of expressed sequences from coffee genome potentially related with the resistance to diseases

Alvarenga, Samuel Mazzinghy 16 July 2007 (has links)
Submitted by Nathália Faria da Silva (nathaliafsilva.ufv@gmail.com) on 2017-06-06T14:03:32Z No. of bitstreams: 1 texto completo.pdf: 1133771 bytes, checksum: 640defa7d0749c719bdf5d760421654a (MD5) / Made available in DSpace on 2017-06-06T14:03:32Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1133771 bytes, checksum: 640defa7d0749c719bdf5d760421654a (MD5) Previous issue date: 2007-07-16 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Para isso foram usadas três estrategias. Inicialmente, palavras-chave correspondentes a termos relacionados aos mecanismos de resistência de plantas a patógenos foram identificadas na literatura e utilizadas como “iscas” para a mineração dos dados. Com o auxílio de ferramentas disponíveis na plataforma de bioinformática do PBGC, foram identificadas ESTs (Expressed Sequence Tags) relacionadas a cada uma destas palavras. Outra estrategia utilizada foi a busca por similaridades entre algumas sequências públicas envolvidas com a resistência do cafeeiro a doenças com as sequências do PBGC, por meio do programa BLAST. Utilizou-se, também, o Electronic Northern, uma ferramenta desenvolvida pelo Laboratório de Genômica e Expressão (LGE). A mineração, usando as três estrategias, identificou 14.060 sequências do PBGC. Essas sequências apresentaram similaridade com proteínas conhecidamente relacionadas com o processo de defesa da planta contra doenças como, por exemplo, quitinase, proteína quinase, citocromo P450, proteína de resistência a doenças, proteína relacionada com patogênese, proteínas com domínio LRR e NBS, proteínas induzidas por hipersensibilidade, entre outras. Os processos biológicos com os quais essas sequências estão envolvidas incluíram metabolismo, transporte, regulação da transcrição, enovelamento de proteínas, biossíntese entre outros. A análise global baseada em ontologia de função molecular das sequências obtidas mostrou que os genes estão envolvidos com metabolismo, resposta a estímulos externos, diferenciação celular, ligação a ácidos nucleicos, ligação a nucleotídeos, resposta de defesa, apoptose entre outras. Visando verificar o envolvimento destas sequências com a resistência do cafeeiro a ferrugem foram desenhados 40 primers para amplificar algumas das sequências mineradas. Os primers foram desenhados com o programa computacional Primer3 e a estabilidade desses foi verificada por meio do programa PrimerSe/ect. Diferentes concentrações dos componentes da reação de PCR foram analisadas. Utilizando as condições de reação e amplificação otimizadas, os 40 primers foram testados em 12 genótipos resistentes e 12 susceptíveis a Hemi/eia vastatrix, fungo causador da ferrugem. Vinte e nove destes 40 primers resultaram em bandas únicas e bem definidas, sendo um polimórfico. Este trabalho permitiu obter, até o momento, um marcador molecular polimórfico entre os indivíduos resistentes e susceptíveis. Esse marcador, denominado CARF 005, amplifica uma região do DNA que corresponde a uma ORF parcial de Coffea arabica que codifica uma proteína de resistência a doenças. / For that, three strategies were used. Initially, keywords related to the plants resistance mechanism to pathogens were searched in scientific literature and used as drivers for data mining. Using the available tools at the PBGC bioinformatics platform, ESTs (Expressed Sequence Tags) related to each one of these words were identified. The search for similarities between some published sequences and sequences from the PBGC, by using the BLAST program was another strategy. The Electronic Northern, a tool developed by the Laboratório de Genômica e Expressão (LGE), was also used. Those strategies allowed the identification of 14,060 sequences of the PBGC. These sequences were similar to proteins known to be related to de plant disease defense process, for instance chitinase, kinase protein, cytochrome P450, disease resistance protein, pathogenesis related protein, LRR and NBS proteins, hypersensibility induced protein among others. The biological processes with witch these sequences are involved included metabolism, transport, transcription regulation, protein folding, biosynthesis and others. The ontology-based global analysis for molecular function showed that the genes are involved with metabolism, external stimulus response, cellular differentiation, nucleic acid binding, nucleotide binding, defense response, apoptosis and others. Aiming to verify the involvement of these sequences with the coffee tree resistance to leaf rust, 40 primers were designed to amplify the mined sequences. The primers were synthesized using the computational program Primer3 and their stability was tested by the program PrimerSelect. Different PCR conditions were tested. Using optimized reaction and amplification conditions, those 40 primers were tested in 12 resistant and 12 susceptible genotypes to Hemileia vastatrix, fungus that causes coffee leaf rust. Twenty nine of those resulted in unique and sharp bands, and only one of these was polymorphic. The 40 primers permitted to find one molecular marker polymorphic between the resistant and susceptible genotypes. This marker amplifies a region of the DNA which corresponds to a Coffea Arabica ORF for disease resistance protein.
276

Análise de dados de RNA-Seq com diferentes números de fatores e repetições / Analysis of RNA-Seq data with different numbers of factors and replicates

Souza, Vladimir Barbosa Carlos de 22 July 2015 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2016-01-12T15:37:38Z No. of bitstreams: 1 texto completo.pdf: 951571 bytes, checksum: 4dbc5e1f76cd2f929b03b81a421aa366 (MD5) / Made available in DSpace on 2016-01-12T15:37:38Z (GMT). No. of bitstreams: 1 texto completo.pdf: 951571 bytes, checksum: 4dbc5e1f76cd2f929b03b81a421aa366 (MD5) Previous issue date: 2015-07-22 / Fundação de Amparo à Pesquisa do Estado de Minas Gerais / A tecnologia RNA-Seq mostrou-se ser revolucionária para o estudo de expressão gênica. Porém, mais estudos na literatura sobre a análise de dados de RNA-Seq são necessários, até mesmo porque se trata de um método de elevado custo. Devido a este alto custo, é importante o aproveitamento das amostras disponíveis para concluir sobre mais fatores e suas interações. Este trabalho tem como objetivo realizar um comparativo do desempenho da análise de identificação de DEGs (genes diferencialmente expressos) em experimentos com diferentes números de fatores e repetições, mas todos com o mesmo número de amostras, ou seja, com o mesmo custo. Para as análises, foram simulados conjuntos de dados provenientes de experimentos com diferentes números de fatores e repetições. Para a realização dessas simulações foi utilizado o pacote TCC, desenvolvido para o software livre R, para a normalização dos dados também foi utilizado o TCC, e para a identificação dos DEGs foi utilizado o pacote DESeq, também desenvolvido para o R. Por último, o desempenho das análises de cada experimento foi calculado utilizando-se curvas ROC (Receiver Operating Characteristics), usando-se o pacote ROCR, também disponível para o R. Após o cumprimento da metodologia, pôde-se observar que, na ausência de interação entre fatores, não ocorre perda de desempenho das análises ao adicionar mais fatores, e, quando existe interação entre fatores, ocorre essa perda. Portanto, o uso de mais fatores, ao custo de se ter menos repetições, pode ser vantajoso. / The RNA-Seq technology show to be revolutionary for gene expression studies. However, more studies in literature about the analysis of RNA-Seq data are necessary, even because it is a costly method. Because of that high cost, it is important to take the full advantage of the available samples to conclude about more factors and its interactions. The aim of this work is to perform a comparative of the performance of DEGs (differential expression genes) identification analysis in experiments with different numbers of factors and replicates, but all of them with the same number of samples, or, in other words, with the same cost. For the analysis, was simulated a dataset from experiments with different numbers of factors and replicates. The package TCC, developed to the free software R, was used to perform that simulation. For the normalization of the data, TCC was also used, and for the DEGs identification the package DESeq was used, also developed to R. Finally, the performance of the analysis of each experiment was calculated with the use of ROC (Receiver Operating Characteristics) Curves, using the package ROCR, also available for R. After the implementation of the methodology, it was possible to observe that, when absence of interactions between factors, do not occur loss of analysis's performance when more factors are added, and, when there are interactions of factors, that loss happens. Therefore, the use of more factors, to the cost of having less replicates, may be advantageous.
277

Melhoria da Sensibilidade em dados de proteômica Shotgun usando redes neurais artificiais sensíveis ao custo e o algoritmo threshold selector / Improving sensitivity in shotgun proteomics using cost sensitive artificial neural networks and a threshold selector algorithm

Ricardo, Adilson Mendes 07 December 2015 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2016-02-16T08:33:17Z No. of bitstreams: 1 texto completo.pdf: 4266396 bytes, checksum: 856cd30ea465e06e8c9ff8dc295ffd91 (MD5) / Made available in DSpace on 2016-02-16T08:33:17Z (GMT). No. of bitstreams: 1 texto completo.pdf: 4266396 bytes, checksum: 856cd30ea465e06e8c9ff8dc295ffd91 (MD5) Previous issue date: 2015-12-07 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Antecedentes: Este trabalho apresenta uma estratégia de aprendizagem de máquina para aumentar sensibilidade na análise de dados de espectrometria de massa para identificação de peptídeos / proteínas. A espectrometria de massa em tandem é uma técnica de química analítica amplamente utilizada para identificar as proteínas em misturas complexas, dando origem a milhares de espectros em uma única corrida que são depois interpretados por software. A maioria destas abordagens computacionais usam bancos de dados de proteínas para realizar a interpretação dos espectros, ou seja, para cada um, obter a melhor correspondência entre o mesmo e a sequência de um peptídeo obtido computacionalmente, a partir das sequências de proteínas do banco de dados. As correspondências espectro-peptídeo (PSM - peptide-spectrum matches) também devem ser avaliadas por ferramentas computacionais já que a análise manual não é possível em função do volume. A estratégia do banco de dados target-decoy é largamente utilizada para avaliação de PSMs. No entanto, em geral, o método não considera a sensibilidade, apenas a estimativa de erro. Resultados: Em trabalho de pesquisa anterior, o método MUMAL aplica uma rede neural artificial para gerar um modelo para classificar PSMs usando a estratégia do banco de dados target-decoy para o aumento da sensibilidade. Entretanto, o presente trabalho de pesquisa mostra que a sensibilidade pode ser melhorada com a utilização de uma matriz de custo associada com o algoritmo de aprendizagem. Demonstra-se também que a utilização do algoritmo threshold selector para o ajuste de probabilidades conduz a valores mais coerentes de probabilidade atribuídos para os PSMs, o que afeta positivamente a etapa de inferência de proteínas. Portanto, a abordagem aqui proposta, denominada MUMAL2, fornece duas contribuições para proteômica shotgun. Em primeiro lugar, o aumento no número de espectros corretamente interpretados no nível de peptídeo aumenta a chance de identificar mais proteínas. Em segundo lugar, os valores mais adequados de pro- babilidade dos PSMs produzidos pelo algoritmo threshold selector impactam de forma positiva a fase de inferência de proteínas, realizada por programas que levam em conta estas probabilidades, tais como o ProteinProphet. Os experimentos demonstraram que o MUMAL2 fornece um maior número de verdadeiros positivos em comparação com métodos convencionais para avaliação de PSMs. Esta nova abordagem atingiu cerca de 15% de melhoria na sensibilidade em comparação com o melhor método atual. Além disso, a área sob a curva ROC obtida foi de 0,93, o que demonstra que as probabi- lidades geradas pelo MUMAL2 são, de fato, apropriadas. Finalmente, diagramas de Venn comparando o MUMAL2 com o melhor método atual mostram que o número de peptídeos exclusivos encontrado pelo MUMAL2 foi quase quatro vezes superior, o que impacta diretamente a cobertura do proteoma. Conclusões: A inclusão de uma matriz de custos e do algoritmo threshold selector na tarefa de aprendizagem melhora, ainda mais, a análise pela estratégia banco de dados target-decoy para identificação dos peptídeos, e contribui de forma eficaz para a difícil tarefa de identificação no nível de proteínas, resultando em uma poderosa ferramenta computacional para a proteômica shotgun. / Background: This work presents a machine learning strategy to increase sensitivity in mass spectrometry data analysis for peptide/protein identification. Tandem mass spectrometry is a widely used analytical chemistry technique used to identify proteins in complex mixtures, yielding thousands of spectra in a single run which are then inter- preted by software. Most of these computer programs use a protein database to match peptide sequences to the observed spectra. The peptide-spectrum matches (PSMs) must also be assessed by computational tools since manual evaluation is not practica- ble. The target-decoy database strategy is largely used for PSM assessment. However, in general, the method does not account for sensitivity, only for error estimate. Re- sults: In a previous study, we proposed the method MUMAL that applies an artificial neural network to effectively generate a model to classify PSMs using decoy hits with increased sensitivity. Nevertheless, the present approach shows that the sensitivity can be further improved with the use of a cost matrix associated with the learning algo- rithm. We also demonstrate that using a threshold selector algorithm for probability adjustment leads to more coherent probability values assigned to the PSMs. Our new approach, termed MUMAL2, provides a two-fold contribution to shotgun proteomics. First, the increase in the number of correctly interpreted spectra in the peptide level augments the chance of identifying more proteins. Second, the more appropriate PSM probability values that are produced by the threshold selector algorithm impact the protein inference stage performed by programs that take probabilities into account, such as ProteinProphet. Our experiments demonstrated that MUMAL2 provides a higher number of true positives compared with standard methods for PSM evaluation. This new approach reached around 15% of improvement in sensitivity compared to the best current method. Furthermore, the area under the ROC curve obtained was 0.93, demonstrating that the probabilities generated by our model are in fact appro- priate. Finally, Venn diagrams comparing MUMAL2 with the best current method show that the number of exclusive peptides found by our method was nearly 4-fold higher, which directly impacts the proteome coverage. Conclusions: The inclusion of a cost matrix and a probability threshold selector algorithm to the learning task further improves the target-decoy database analysis for identifying peptides, which optimally contributes to the challenging task of protein level identification, resulting in a powerful computational tool for shotgun proteomics.
278

Uma proposta de algoritmo memético baseado em conhecimento para o problema de predição de estruturas 3-D de proteínas

Correa, Leonardo de Lima January 2017 (has links)
Algoritmos meméticos são meta-heurísticas evolutivas voltadas intrinsecamente à exploração e incorporação de conhecimentos relacionados ao problema em estudo. Nesta dissertação, foi proposto um algoritmo memético multi populacional baseado em conhecimento para lidar com o problema de predição de estruturas tridimensionais de proteínas voltado à modelagem de estruturas livres de similaridades conformacionais com estruturas de proteínas determinadas experimentalmente. O algoritmo em questão, foi estruturado em duas etapas principais de processamento: (i) amostragem e inicialização de soluções; e (ii) otimização dos modelos estruturais provenientes da etapa anterior. A etapa I objetiva a geração e classificação de diversas soluções, a partir da estratégia Lista de Probabilidades Angulares, buscando a definição de diferentes grupos estruturais e a criação de melhores estruturas a serem incorporadas à meta-heurística como soluções iniciais das multi populações. A segunda etapa consiste no processo de otimização das estruturas oriundas da etapa I, realizado por meio da aplicação do algoritmo memético de otimização, o qual é fundamentado na organização da população de indivíduos em uma estrutura em árvore, onde cada nodo pode ser interpretado como uma subpopulação independente, que ao longo do processo interage com outros nodos por meio de operações de busca global voltadas a características do problema, visando o compartilhamento de informações, a diversificação da população de indivíduos, e a exploração mais eficaz do espaço de busca multimodal do problema O algoritmo engloba ainda uma implementação do algoritmo colônia artificial de abelhas, com o propósito de ser utilizado como uma técnica de busca local a ser aplicada em cada nodo da árvore. O algoritmo proposto foi testado em um conjunto de 24 sequências de aminoácidos, assim como comparado a dois métodos de referência na área de predição de estruturas tridimensionais de proteínas, Rosetta e QUARK. Os resultados obtidos mostraram a capacidade do método em predizer estruturas tridimensionais de proteínas com conformações similares a estruturas determinadas experimentalmente, em termos das métricas de avaliação estrutural Root-Mean-Square Deviation e Global Distance Total Score Test. Verificou-se que o algoritmo desenvolvido também foi capaz de atingir resultados comparáveis ao Rosetta e ao QUARK, sendo que em alguns casos, os superou. Corroborando assim, a eficácia do método. / Memetic algorithms are evolutionary metaheuristics intrinsically concerned with the exploiting and incorporation of all available knowledge about the problem under study. In this dissertation, we present a knowledge-based memetic algorithm to tackle the threedimensional protein structure prediction problem without the explicit use of template experimentally determined structures. The algorithm was divided into two main steps of processing: (i) sampling and initialization of the algorithm solutions; and (ii) optimization of the structural models from the previous stage. The first step aims to generate and classify several structural models for a determined target protein, by the use of the strategy Angle Probability List, aiming the definition of different structural groups and the creation of better structures to initialize the initial individuals of the memetic algorithm. The Angle Probability List takes advantage of structural knowledge stored in the Protein Data Bank in order to reduce the complexity of the conformational search space. The second step of the method consists in the optimization process of the structures generated in the first stage, through the applying of the proposed memetic algorithm, which uses a tree-structured population, where each node can be seen as an independent subpopulation that interacts with others, over global search operations, aiming at information sharing, population diversity, and better exploration of the multimodal search space of the problem The method also encompasses ad-hoc global search operators, whose objective is to increase the exploration capacity of the method turning to the characteristics of the protein structure prediction problem, combined with the Artificial Bee Colony algorithm to be used as a local search technique applied to each node of the tree. The proposed algorithm was tested on a set of 24 amino acid sequences, as well as compared with two reference methods in the protein structure prediction area, Rosetta and QUARK. The results show the ability of the method to predict three-dimensional protein structures with similar foldings to the experimentally determined protein structures, regarding the structural metrics Root-Mean-Square Deviation and Global Distance Total Score Test. We also show that our method was able to reach comparable results to Rosetta and QUARK, and in some cases, it outperformed them, corroborating the effectiveness of our proposal.
279

Caracterização funcional e estudo do comportamento dinâmico da proteína MntC de Staphylococcus aureus

Castro, Natália Salazar de January 2014 (has links)
Orientadora: Profa. Dra. Ana Paula de Mattos Arêas Dau / Tese (doutorado) - Universidade Federal do ABC, Programa de Pós-Graduação em Biossistemas, 2014. / Infeccoes causadas por Staphylococcus aureus representam uma grande preocupacao, principalmente aquelas relacionadas ao ambiente hospitalar. Normalmente, a fase inicial consiste em colonizacao assintomatica da parte nasal da faringe, o que pode resultar na disseminacao para outras superficies mucosas ou invasao de locais estereis, tais como o sangue. O estabelecimento da infeccao depende da obtencao de nutrientes, assim como ligacao e dano a matriz extracelular (MEC). A proteina MntC e altamente conservada em S. aureus, sendo caracterizada como uma proteina de superficie relacionada ao transporte do ion manganes, indispensavel para a sobrevivencia da bacteria. Assim como outras proteinas transportadoras de metal, MntC pertence ao Cluster 9, uma grande familia de proteinas bacterianas de ligacao a metais pertencentes a sistemas de transporte ABC. Os estudos teoricos sobre o comportamento dinamico da MntC e de proteinas homologas utilizando as tecnicas de Modelagem Comparativa, Modos Normais e Dinamica Molecular mostram que a ligacao ao metal nao afeta muito a flexibilidade das proteinas. As mudancas estruturais e dinamicas sofridas por estas ao se ligarem ao metal podem ser pequenas e em regioes proximas ao sitio de ligacao ao metal, principalmente nas estruturas em loops, corroborando o observado em trabalhos experimentais ja publicados. Neste trabalho, foi demonstrado que alem de sua funcao como transportadora de manganes, MntC e uma eficiente proteina de ligacao a MEC, moleculas da cascata da coagulacao, e ao regulador negativo do Sistema Complemento Fator H. Este estudo mostrou uma capacidade acentuada da MntC de ligar a laminina, colageno tipo IV, fibronectina celular e plasmatica, plasminogenio e fibrinogenio por ELISA. MntC tambem foi capaz de ligar ao Fator H observado em Western blot. A ligacao da MntC ao plasminogenio parece ser mediada, pelo menos parcialmente, pelas lisinas expostas na superficie da proteina, uma vez que previa incubacao com um analogo da cadeia lateral do residuo de lisina, acido ¿Ã-aminocaproico, ou o aumento da forca ionica afeta a interacao entre MntC e plasminogenio, por ELISA. A proteina tambem contribui para a ativacao da plasmina a partir do plasminogenio observada em reacao cromogenica, na presenca do ativador de plasminogenio uroquinase (uPA). A plasmina recem gerada, por sua vez, atuou na clivagem do fibrinogenio, observada em membranas de difluoreto de polivinilideno coradas com Coomassie. A enzima tambem foi capaz de clivar C3b, observado por Western blot. Em conclusao, neste trabalho foi demonstrado que na MntC, e em outros membros da familia cluster 9, a ligacao ao metal induz mudancas conformacionais bastante restritas as regioes envolvidas na coordenacao do metal. Neste estudo tambem foi descrita uma nova funcao para MntC que pode auxiliar a bacteria na colonizacao de mucosa e posterior estabelecimento de doencas invasivas. Alem disso, a interacao de MntC com proteinas do sistema complemento pode auxiliar a bacteria na evasao imune. Estes dados sugerem que a proteina MntC e um fator de virulencia relevante para as infeccoes de S. aureus e por isso, pode ser um bom candidato para compor uma formulacao vacinal anti-estafilococica para humanos. / Infections caused by Staphylococcus aureus represent a great concern, mainly those related to nosocomial environment. Usually, the early stage of pathogenesis consists on asymptomatic nasopharynx colonization, which could result in dissemination to other mucosal niches or invasion of sterile sites, such as blood. This pathogenic route depends on scavenging of nutrients as well as binding to and disrupting extracellular matrix (ECM). The MntC is a highly conserved protein on the surface of S. aureus, involved in the transport of manganese ion, essential for survival of the bacterium. As other metal-transport proteins, MntC belongs to cluster 9, a large family of bacterial metal binding proteins that composes ABC transport systems. Theoretical studies on the dynamic behavior of MntC and homologous proteins using Comparative Modeling, Normal Modes and Molecular Dynamics techniques show that the flexibility of the proteins is not greatly affected by metal binding. The structural and dynamic changes suffered by cluster 9 proteins upon binding of metal may be restricted to regions close to the metal binding site. It is especially relevant in loops structures, corroborating results previously observed in experimental studies published elsewhere. This work provided evidence of a novel function of MntC besides manganese-binding activity. MntC was shown to be an efficient ECM, coagulation cascade components, and complement regulatory factor H binding protein. This study showed a marked ability of MntC to bind to laminin, collagen type IV, cellular and plasma fibronectin, plasminogen and fibrinogen by ELISA. MntC was also able to bind to complement factor H observed in Western Blot. The MntC binding to plasminogen appears to be, at least partially, related to the presence of lysines, since previous incubation with an analogue of lysine residue, å-aminocaproic acid, or increasing ionic strength affected the interaction between MntC and plasminogen, assayed by ELISA. The protein also contributed to the activation of plasmin from plasminogen observed in a chromogenic reaction in the presence of urokinase plasminogen activator (uPA). The newly released plasmin, in turn, acted in the cleavage of fibrinogen observed in polyvinylidene difluoride membranes stained with Coomassie. This enzyme was also able to cleave C3b observed by Western Blot. In conclusion, it was demonstrated that in MntC, and in other cluster 9 members, metal binding event induces conformational changes very restricted to regions involved in metal coordination. This work also described a new role for MntC that can aid mucosal colonization and the establishment of invasive diseases as well. Moreover, the interaction of MntC with complement system proteins could contribute to host immune evasion. These data suggest that MntC is a relevant virulence factor to staphylococcal infections and, therefore, could be an adequate candidate to compose an anti-staphylococcal human vaccine formulation
280

Uma nova metodologia para estudar proteínas com região de desordem

Kliousoff Junior, André January 2015 (has links)
Orientador: Prof. Dr. Luis Paulo Barbour Scott / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, 2015. / Proteínas são macromoléculas essenciais para a maioria dos processos biológicos, atuando com grande versatilidade de funções. Existem, porém, proteínas chamadas desordenadas ou com regiões de desordem em sua cadeia de aminoácidos. A literatura discute a participação de proteínas com regiões de desordem em processos biológicos chaves, como controle celular, regulação, reconhecimento e sinalização e também em processos biológicos importantes de doenças como câncer, diabetes, distúrbios cardiovasculares e doenças neurodegenerativas. A existência de proteínas desordenadas como agentes funcionais contraria a visão clássica de que uma proteína deva apresentar uma estrutura tridimensional para assumir uma função. O estudo de proteínas intrinsicamente desordenadas ganhou mais atenção na última década, com o surgimento de algoritmos e técnicas de predição voltadas a essas proteínas. Além dos estudos de predição de proteínas com regiões de desordem, hoje há também necessidades como a de entender sua relação com outros processos. A identificação de propriedades estruturais de proteínas intrinsicamente desordenadas permanece sendo um dos desafios nesta área. Neste trabalho investigamos padrões na estrutura primária/secundária e nas propriedades físico-quimicas das regiões de desordem e em suas vizinhanças, por meio de mineração de dados. Os resultados obtidos nesta pesquisa visam contribuir para os trabalhos de predição de regiões de desordem, as características físico-químicas que determinam tais regiões e sua diferenciação em relação a regiões ordenadas. / Proteins are essential macromolecules for almost biological processes. Several works indicated the involvement of proteins with disordered regions in important biological processes such as control, cell regulation, recognition and signaling and also in important processes of diseases like cancer, diabetes, cardiovascular disorders and neurodegenerative diseases. The presence of disordered proteins as functional agents contradicts the classical view that a protein needs to have a three-dimensional structure to assume a function. The intrinsically disordered proteins research has been growing in the last decade, with the advent of predictive algorithms and techniques applied to study these proteins. Nowadays, there is the necessity to understand its relationship with other processes. One of the challenges in this subject is to identify structural properties of intrinsically disordered proteins. This research work investigates patterns in primary/secondary structures, looking for physicochemical properties of the regions of disorder and in their neighborhoods through data mining techniques. The results achieved in this research aims to contribute to disorder predict research, studies about the physicochemical properties of the regions of disorder and its differentiation compared to ordered regions.

Page generated in 0.04 seconds