• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
301

Aplicação de rede neural artificial para o reconhecimento do diabetes mellitus gestacional com marcadores não-glicêmicos

Bandeira, Ana Paula Filus January 2015 (has links)
Orientador : Prof. Dr. Geraldo Picheth / Co-orientadora : Profª. Drª. Jeroniza Nunes Marchaukoski / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 13/04/2015 / Inclui referências / Resumo: O Diabetes mellitus gestacional (DMG) afeta cerca de 7% das gestações e tem impacto importante para a gestante, o feto e o neonato. O diagnóstico do DMG é realizado com base na determinação da glicemia em jejum e após sobrecarga. A identificação de padrões com base em características antropométricas e laboratoriais pode ser de interesse no processo de triagem do DMG. Nesse trabalho, o toolbox, open source, "WEKA" foi empregado, utilizando os algoritmos simple k-means e simple logistic, para a classificação de variáveis não-glicêmicas. A rede neural artificial, multilayer perceptron (MLP), foi aplicada na busca da identificação automática do DMG. A base do estudo foi uma amostra de 997 gestantes (699 = gestantes saudáveis (controle); 298 = gestantes com diabetes gestacional (DMG)) utilizando critérios glicêmicos estabelecidos pela American Diabetes Association. Os marcadores discriminantes selecionados com auxílio dos algoritmos k-means e simple logistic foram idade, peso, índice de massa corporal, pressão arterial sistólica, pressão arterial diastólica, ácido úrico, triglicérides, colesterol não HDL e Log(TG/HDL-C). Estas variáveis foram aplicadas na rede neural MLP para a classificar gestantes com DMG. A MLP devidamente treinada e testada permitiu 88% de predições corretas, estabelecendo uma sensibilidade de 92,1%, especificidade de 83,8% e acurácia de 87,5%. Em síntese, a metodologia desenvolvida neste trabalho é de baixo custo e uma alternativa de "segunda opinião" para a triagem do DMG. Palavras-chave: Diabetes mellitus gestacional; sistemas de apoio à decisão clínica; WEKA, k-means, simple-logistic, redes neurais artificiais. / Abstract: The gestational diabetes mellitus (GDM) affects about 7% of pregnancies and has an important impact on the mother, the fetus and the newborn. The diagnosis of GDM is based on the determination of fasting and post-load glycemia. The identification of patterns based on anthropometric and laboratory parameters can be of interest in the screening process of DMG. In this work, the toolbox, open source, "WEKA" was employed, using the simple k-means and simple logistic algorithms, for non-glycemic variables rating. The artificial neural network, multilayer perceptron (MLP), was applied in the search for automatic identification of the DMG. The basis of the study was a sample of 997 patients (699 = healthy pregnant women (control); 298 = pregnant women with gestational diabetes (GDM)) using glycemic criteria established by the American Diabetes Association. The discriminant markers selected with the help of k-means and simple logistic algorithms were age, weight, body mass index, systolic blood pressure, diastolic blood pressure, uric acid, triglycerides, non-HDL cholesterol and Log(TG/HDL-C). These variables were applied in MLP to classify pregnant women with GDM. The MLP network properly trained and tested allowed 88% of correct predictions, establishing a sensitivity of 92.1%, specificity of 83.8% and accuracy of 87.5%. In summary, the methodology developed in this work is low cost and an appropriate alternative to "second opinion", allowing GDM screening. Keywords: gestational diabetes; decision support systems; WEKA; k-means; simple logistic; artificial neural networks.
302

Análise de elementos cis-acting em regiões promotoras de genes relacionados com desenvolvimento radicular em arroz (Oryza sativa L.) / ANALYSIS OF CIS-ACTING ELEMENTS IN THE REGIONS OF PROMOTING GENES RELATED TO ROOT DEVELOPMENT

Farias, Daniel da Rosa 28 June 2013 (has links)
Submitted by Gabriela Lopes (gmachadolopesufpel@gmail.com) on 2016-09-28T14:00:15Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) dissertação.pdf: 1451490 bytes, checksum: 8db111be8fc2a2a277ed6aa88f84a6e6 (MD5) / Approved for entry into archive by Aline Batista (alinehb.ufpel@gmail.com) on 2016-09-28T19:03:52Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) dissertação.pdf: 1451490 bytes, checksum: 8db111be8fc2a2a277ed6aa88f84a6e6 (MD5) / Made available in DSpace on 2016-09-28T19:03:52Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) dissertação.pdf: 1451490 bytes, checksum: 8db111be8fc2a2a277ed6aa88f84a6e6 (MD5) Previous issue date: 2013-06-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / As raízes possuem uma grande variedade de funções nas plantas, incluindo absorção de água, nutrientes e suporte estrutural. A combinação de métodos clássicos de genética e melhoramento com tecnologias moleculares de análise genômica abre uma nova perspectiva para a ampliação do conhecimento das bases genéticas e aceleração de programas de melhoramento. A maioria dos conhecimentos sobre as redes gênicas envolvidas no desenvolvimento radicular vem sendo acumuladas na espécie Arabidopsis thaliana, modelo de planta dicotiledônea. O entendimento dos mecanismos envolvidos na regulação da expressão dos genes é essencial para compreender a forma e a função dos sistemas. Os elementos cis-acting são regiões do DNA que atuam como interruptores moleculares envolvidos na regulação da transcrição de uma rede gênica dinâmica. Embora freqüentemente tenham somente cinco a 20 pb de tamanho, os elementos cis-acting são críticos para o entendimento da regulação gênica. O conhecimento destes elementos presentes na região promotora de famílias gênicas, poderá contribuir para a compreensão dos sistemas reguladores da expressão da rede gênica envolvida na formação do sistema radicular. O objetivo desse trabalho é identificar os elementos cis-acting presentes na região promotora de genes de arroz (Oryza sativa subsp japonica cv. Nipponbare) similares aos genes das famílias Argonauta, Cullin e Ara de Arabidopsis thaliana. A região promotora dos genes destas famílias no arroz foi investigada quanto à abundância destes elementos. As seqüências foram analisadas utilizando o programa “Signal Scan Search” do portal “Plant Cis-acting Regulatory DNA Elements” (PLACE) para a identificação dos diferentes elementos cis-acting. Foram detectados 96 diferentes elementos, sendo cinco destes (GAREAT (TAACAAR), TGACGTVMAMY (TGACGT), CCAATBOX1 (CCAAT), LECPLEACS2 (TAAAATAT) e SV40COREENHAN (GTGGWWHG), comuns as famílias gênicas Argonauta, Cullin e Ara. / The roots have a large range of functions in plants, including acquisition of water and nutrients, as well as structural support. The combination of classical methods of genetics and breeding with molecular technologies for genomic analysis opens a new perspective to expand the knowledge of the genetic basis and to accelerate breeding programs. The most advanced knowledge regarding gene networks involved in root development has been obtained in the model dicotyledon plant species Arabidopsis thaliana. Understanding the mechanisms involved in regulation of gene expression is essential to predict the form and function of systems. Cis-acting elements are DNA regions that act as molecular switches involved in the regulation of transcription of dynamic gene network. Although often having only five to 20 bp in size, cis-acting elements are critical to the understanding of gene regulation. Knowledge of the cis-acting elements present in the promoter region of gene families, can contribute to the understanding of the expression regulatory systems of these genes and others, involved with the root system. The objective of this study is to identify the cisacting elements present in the upstream region of rice (Oryza sativa subsp japonica cv. Nipponbare) genes, similar to gene families Argonauta, Cullin and Ara in Arabidopsis thaliana. The promoter region of these rice gene families were investigated for the abundance of cis-acting elements. The sequences were analyzed using the software “Signal Scan Search” of the website “Plant Cis-acting Regulatory DNA Elements” (PLACE) to the identification of different cis-acting elements. It were detected 96 different cis-acting elements, and five of these, (GAREAT (TAACAAR), TGACGTVMAMY (TGACGT), CCAATBOX1 (CCAAT), LECPLEACS2 (TAAAATAT) e SV40COREENHAN (GTGGWWHG) were common to the gene families Argonauta, Cullin and Ara.
303

Um circuito neural canônico com inibição feedback e feedforward

Teixeira, Daniel Garcia 29 March 2018 (has links)
Submitted by Automação e Estatística (sst@bczm.ufrn.br) on 2018-05-03T22:57:21Z No. of bitstreams: 1 DanielGarciaTeixeira_DISSERT.pdf: 2395648 bytes, checksum: d18ab806f8ec064f97c3987cacc1c194 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2018-05-14T21:12:24Z (GMT) No. of bitstreams: 1 DanielGarciaTeixeira_DISSERT.pdf: 2395648 bytes, checksum: d18ab806f8ec064f97c3987cacc1c194 (MD5) / Made available in DSpace on 2018-05-14T21:12:24Z (GMT). No. of bitstreams: 1 DanielGarciaTeixeira_DISSERT.pdf: 2395648 bytes, checksum: d18ab806f8ec064f97c3987cacc1c194 (MD5) Previous issue date: 2018-03-29 / A oscilação gama está presente em diversas áreas do cérebro, como no hipocampo, desempenhando um importante mecanismo para o funcionamento da memória. Encontramos diversos modelos capazes de explicar a geração das oscilações gama e explicam suas duas funcionalidades, agrupamento sincronizado temporalmente das sinapses dos neurônios e a de selecionar quais neurônios devem disparar em cada ciclo deste sincronismo. Funcionalidades estas que imprimem um caráter computacional do processamento neural a este sistema, como a separação de padrões e a formação de assembleias neurais. Porém, a análise destes modelos existentes demonstra ser muito sensível às variações das atividades cerebrais, sendo fortemente afetados por variações nas suas camadas de entrada, de modo a aparentar não possuir uma boa robustez, gerando muita variação de sua frequência de saída, assim como na competitividade entre estes neurônios. Entretanto, ao se considerar uma importante parte do circuito biológico não considerada em trabalhos anteriores, uma rede de inibição alimentada à frente nos possibilitou a criação de um novo modelo. Baseando-nos no modelo de neurônio de Izhikevich, geramos um novo modelo com uma maior estabilidade em sua saída às variações na camada de entrada, bem como um custo computacional reduzido e proximidade do modelo biológico. Em posse deste novo modelo, será possível criar redes neurais com maior capacidade de neurônios, com custo computacional reduzido, além da possibilidade de análise do comportamento individual em cada neurônio do modelo. / Gamma oscillation is present in several areas of the brain, such as the hippocampus, playing an important mechanism for memory functioning. We found several models capable of explaining the generation of the gamma oscillations and explain their two functionalities, that of synchronously grouping the synapses of the neurons and of selecting which neurons must trigger in each cycle of this synchronism. These functionalities impart a computational character of neural processing to this system, such as the separation of patterns and the formation of neural assemblies. However, the analysis of these existent models shows to be very sensitive to the variations of the cerebral activities, being strongly affected by variations and their layers of entrance, in order to appear not to have a good robustness, generating much variation of their frequency of exit, as in between these neurons. However, when considering an important part of the biological circuit not considered in previous studies, a fed-in inhibition network enabled us to create a new model. Based on the Izhikevich neuron model, we generated a new model with greater robustness to the variations in the input layer, as well as a reduced computational cost and proximity of the biological model. In the possession of this new model, it will be possible to create neural networks with greater capacity of neurons, with reduced computational cost, besides the possibility of analyzing the individual behavior in each neuron of the model.
304

Algoritmos de aprendizado semi-supervisionado baseados em grafos aplicados na bioinformática /

Negretto, Diego Henrique. January 2016 (has links)
Orientador: Fabrício Aparecido Breve / Banca: Moacir Antonelli Ponti / Banca: Daniel Carlos Guimarães Pedronette / Resumo: As pesquisas realizadas para o Sequenciamento de Genomas, Proteômica, Sistemas Biológicos, Diagnósticos Médicos, entre outros, geram uma grande quantidade de dados, fazendo necessário o apoio de soluções computacionais para a análise e interpretação desses dados. A utilização de técnicas de Aprendizado de Máquina, para a extração de conhecimentos úteis dessas grandes quantidades de dados, tem sido amplamente discutida entre pesquisadores da Biologia e da Computação. O processo para se rotular todos os dados gerados pelas pesquisas biológicas, assim como em outras áreas, é difícil, caro e/ou demorado. Assim, buscar maneiras de se atingir uma grande acurácia com poucos dados rotulados torna-se uma tarefa importante e desafiadora. Nesse sentido, o Aprendizado SemiSupervisionado mostra-se como uma opção importante uma vez que utiliza dados rotulados e não rotulados para o treinamento, sendo uma categoria intermediária entre o Aprendizado Supervisionado e o Não Supervisionado. Diversas abordagens para algoritmos de Aprendizado Semi-Supervisionado são encontradas na literatura. Dentre elas, destacam-se os métodos baseados em grafos, que representam os dados de entrada como nós de um grafo cuja estrutura é utilizada para propagar informações de rótulos dos nós rotulados para os demais nós. Destaca-se ainda que a abordagem baseada em grafos possui uma grande fundamentação matemática e computacional. Nesse contexto, este trabalho apresenta uma análise comparativa de alguns algoritmos semi-supervisionados, baseados em grafos, quando aplicados a dados biológicos relacionados aos campos de estudos da Proteômica e Transcriptômica. Adicionalmente, o trabalho propõe um novo dataset com dados reais oriundos de pesquisas biológicas com o transcriptoma de formigas da espécie Mycocepurus goeldii. Alguns experimentos realizados com os algoritmos semi-supervisionados são apresentados, levando em consideração sua... / Abstract: Research conducted for the sequencing of genomes, Proteomics, Systems Biology, Medical Diagnostics, among others, generate a lot of data, making it necessary the support of computing solutions for the analysis and interpretation of such data. The possibility of using machine learning techniques to extract useful knowledge of these large amounts of data has been widely discussed among researchers of Biology and Computer Science. The process of labeling all data generated by biological research, as well as in other areas, is difficult, costly and / or time consuming. Thus, searching ways to achieve a high accuracy with few labeled data is an important and challenging task. Accordingly, the Semi-Supervised Learning shows up as an important option since it uses both labeled and unlabeled data for training, being an intermediate category between the Supervised and Unsupervised Learning. Several approaches to semi-supervised learning algorithms are found in the literature. Among them, the highlights are the graph-based methods, which represent the input data as nodes in a graph, which structure is used to propagate label information from labeled nodes to the other nodes. It is also noteworthy that the graph-based approach has a great mathematical and computational validity. In this context, this paper presents a comparative analysis of some semi-supervised algorithms based on graphs, when applied to biological data analysis related to the field of proteomics and transcriptomics studies. In addition, the paper proposes a new dataset with actual data from biological research with the transcriptome of the Mycocepurus goeldii species of ants. Some experiments performed with semi-supervised algorithms are presented, considering its efficacy when compared with a few supervised methods / Mestre
305

Uma proposta de algoritmo memético baseado em conhecimento para o problema de predição de estruturas 3-D de proteínas

Correa, Leonardo de Lima January 2017 (has links)
Algoritmos meméticos são meta-heurísticas evolutivas voltadas intrinsecamente à exploração e incorporação de conhecimentos relacionados ao problema em estudo. Nesta dissertação, foi proposto um algoritmo memético multi populacional baseado em conhecimento para lidar com o problema de predição de estruturas tridimensionais de proteínas voltado à modelagem de estruturas livres de similaridades conformacionais com estruturas de proteínas determinadas experimentalmente. O algoritmo em questão, foi estruturado em duas etapas principais de processamento: (i) amostragem e inicialização de soluções; e (ii) otimização dos modelos estruturais provenientes da etapa anterior. A etapa I objetiva a geração e classificação de diversas soluções, a partir da estratégia Lista de Probabilidades Angulares, buscando a definição de diferentes grupos estruturais e a criação de melhores estruturas a serem incorporadas à meta-heurística como soluções iniciais das multi populações. A segunda etapa consiste no processo de otimização das estruturas oriundas da etapa I, realizado por meio da aplicação do algoritmo memético de otimização, o qual é fundamentado na organização da população de indivíduos em uma estrutura em árvore, onde cada nodo pode ser interpretado como uma subpopulação independente, que ao longo do processo interage com outros nodos por meio de operações de busca global voltadas a características do problema, visando o compartilhamento de informações, a diversificação da população de indivíduos, e a exploração mais eficaz do espaço de busca multimodal do problema O algoritmo engloba ainda uma implementação do algoritmo colônia artificial de abelhas, com o propósito de ser utilizado como uma técnica de busca local a ser aplicada em cada nodo da árvore. O algoritmo proposto foi testado em um conjunto de 24 sequências de aminoácidos, assim como comparado a dois métodos de referência na área de predição de estruturas tridimensionais de proteínas, Rosetta e QUARK. Os resultados obtidos mostraram a capacidade do método em predizer estruturas tridimensionais de proteínas com conformações similares a estruturas determinadas experimentalmente, em termos das métricas de avaliação estrutural Root-Mean-Square Deviation e Global Distance Total Score Test. Verificou-se que o algoritmo desenvolvido também foi capaz de atingir resultados comparáveis ao Rosetta e ao QUARK, sendo que em alguns casos, os superou. Corroborando assim, a eficácia do método. / Memetic algorithms are evolutionary metaheuristics intrinsically concerned with the exploiting and incorporation of all available knowledge about the problem under study. In this dissertation, we present a knowledge-based memetic algorithm to tackle the threedimensional protein structure prediction problem without the explicit use of template experimentally determined structures. The algorithm was divided into two main steps of processing: (i) sampling and initialization of the algorithm solutions; and (ii) optimization of the structural models from the previous stage. The first step aims to generate and classify several structural models for a determined target protein, by the use of the strategy Angle Probability List, aiming the definition of different structural groups and the creation of better structures to initialize the initial individuals of the memetic algorithm. The Angle Probability List takes advantage of structural knowledge stored in the Protein Data Bank in order to reduce the complexity of the conformational search space. The second step of the method consists in the optimization process of the structures generated in the first stage, through the applying of the proposed memetic algorithm, which uses a tree-structured population, where each node can be seen as an independent subpopulation that interacts with others, over global search operations, aiming at information sharing, population diversity, and better exploration of the multimodal search space of the problem The method also encompasses ad-hoc global search operators, whose objective is to increase the exploration capacity of the method turning to the characteristics of the protein structure prediction problem, combined with the Artificial Bee Colony algorithm to be used as a local search technique applied to each node of the tree. The proposed algorithm was tested on a set of 24 amino acid sequences, as well as compared with two reference methods in the protein structure prediction area, Rosetta and QUARK. The results show the ability of the method to predict three-dimensional protein structures with similar foldings to the experimentally determined protein structures, regarding the structural metrics Root-Mean-Square Deviation and Global Distance Total Score Test. We also show that our method was able to reach comparable results to Rosetta and QUARK, and in some cases, it outperformed them, corroborating the effectiveness of our proposal.
306

Um sistema baseado em agentes para re-anotação de genomas / An agent-based system for re-annotation of genomes

Nascimento, Leonardo Vianna do January 2005 (has links)
A análise da informação contida em seqüências genéticas tem ganho cada vez mais importância nos dias atuais. A chamada anotação genética tem o objetivo de, a partir de uma ou mais seqüências, determinar suas características estruturais e funcionais. Muitos processos de anotação já foram realizados com êxito aumentando consideravelmente nosso conhecimento acerca do mecanismo genético de diversos organismos. A re-anotação genética é um processo que visa revisar o resultado da anotação, em virtude da disponibilidade de novas informações. Neste trabalho foi desenvolvido um sistema de re-anotação automática, onde tarefas de análise repetitivas podem ser automatizadas e os dados na anotação re-analisados periodicamente, a fim de que possíveis modificações possam ser detectadas. O sistema é baseado na tecnologia de agentes. Cada agente é responsável pela execução de diferentes ferramentas de bioinformática. Ao final do processo, os resultados individuais são combinados a fim de atingir o objetivo da análise. O sistema demonstrou eficácia na análise realizada em organismos procariontes durante a fase de validação. Ambientes de re-anotação como este são ferramentas interessantes a serem futuramente integradas a sistemas de anotação existentes. / The analysis of the information present in genetic sequences is gaining more importance nowadays. The genetic annotation aims to determine structural and functional characteristics of the sequences. Many annotation processes have already been carried out, improving our knowledge about the genetic mechanism of several organisms. The genetic re-annotation is a process that aims to review the annotation results when new information is available. This work presents an automatic re-annotation system where repetitive analysis tasks can be automated and annotation data are periodically re-analysed in order to detect possible differences. The system is based on the agent technology and each agent must execute different bioinformatics tools and merge its results in order to reach the analysis goals. The system proved to be efficient on the analysis carried out in procariotic organisms in the validation process, becoming an interesting tool to be integrated in annotation systems in the future.
307

Modelagem e simulação de algoritmos paralelos baseados em operações com DNA / DNA-Based modelling and simulation of parallel algorithms

Cervo, Leonardo Vieira January 2002 (has links)
A área de biologia computacional está vivendo um crescimento rápido causado pela revolução no estudo de genômas e pelo avanço das técnicas de manipulação do material genético. Com essas novas tecnologias para manipulação de seqüências, a importância de achar uma solução eficiente para os problemas chamados de intratáveis também cresceu, pois muitos problemas envolvidos na análise de DNA pertencem a essa classe de problemas. Uma abordagem para achar essas soluções é usar o próprio DNA para realizar computação, aproveitando o paralelismo massivo utilizado em operações que manipulam seqüências de DNA. Isto é estudado na área de computação com DNA. Esse trabalho propõe um modelo formal para representar a estrutura da molécula de DNA e das operações que são realizadas com ela em laboratório. Este modelo ajuda a preencher a necessidade de uma descrição matemática que possa ser usada para analisar algoritmos baseados em DNA, assim como possibilitar a simulaç~o desses algoritmos em um computador. Foi utilizada a teoria de gramáticas de grafos, uma linguagem de especificação formal, para modelar as seqüências de DNA e suas I operações. O trabalho apresenta um estudo da estrutura da molécula de DNA, deScrevendo suas características e as principais operações que são realizadas para sua manipulação em laboratório. Uma descrição da teoria de Gramática de Grafos e sua aplicação também é apresentada. Para validação do modelo proposto as especificações resultantes foram adaptadas para o formato L-systems, outra linguagem de especificação formal, permitindo realizar a simulação da especificação no ambiente L-Studio. / The area of computational biology is living a fast growth, fed with a revolution in the study of genomes and with the advance in the techniques of genetic material manipulation. With these new technologies for manipulation of sequences, the relevance of finding efficient solution to the so-called computer intractable problems has also grown, because many problems involved in analyzing DNA belong to this class of problems. One approach to find such solutions is to use DNA itself to perform computations, taking advantage of the massive parallelism involved in operations that manipulate DNA sequences. This is what is studied in the area ofDNA computing. This work proposes a formal model to represent the DNA structure and the operations performed in laboratory with it. This model helps to fill the need of a mathematical description that can be used to analyze DNA-based algorithms, as well as for simulating such algorithms in a computer. We use graph grammars, a formal specification language, to model the DNA sequences and operations. The work presents a study of the DNA molecule structure, describing its features and the main operations performed for manipulation in laboratory. A description of the theory of Graph Grammars and its application are presented too. To validate the proposed model, the resulting DNA-graph grammar specifications are then translated into the L-systems format, another formal specification language, allowing for the simulation of the specifications using the L-Studio environment.
308

Triagem in silico de candidatos vacinais contra Toxoplasma gondii / In silico screening of vaccine candidates against Toxoplasma gondii

Inácio, Moisés Morais 06 March 2018 (has links)
Submitted by Erika Demachki (erikademachki@gmail.com) on 2018-04-25T20:07:07Z No. of bitstreams: 2 Dissertação - Moisés Morais Inácio - 2018.pdf: 2052518 bytes, checksum: 343f0c40d2a797544b4af9800b9e5522 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-04-26T11:15:33Z (GMT) No. of bitstreams: 2 Dissertação - Moisés Morais Inácio - 2018.pdf: 2052518 bytes, checksum: 343f0c40d2a797544b4af9800b9e5522 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-04-26T11:15:33Z (GMT). No. of bitstreams: 2 Dissertação - Moisés Morais Inácio - 2018.pdf: 2052518 bytes, checksum: 343f0c40d2a797544b4af9800b9e5522 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-03-06 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Toxoplasma gondii is the causative agent of congenital toxoplasmosis, which manifests as mild chorioretinitis, miscarriage, mental retardation, microcephaly, hydrocephalus, and seizures. Treatment of this disease is limited and a new vaccine represents the best strategy for prevention of the infection. In the present study, the reverse vaccinology combined with immunomics was applied for the development of a vaccine against T. gondii. Using an in silico approach, we identified T. gondii’s proteins that contain signal peptide and transmembrane domain using the ToxoDB® database. We evaluated the homology of these proteins with the human proteome and predicted their epitopes using Blastp, NetMHCpan 3.0 and NetMHCIIpan 3.1 tools. Class I and II HLA alleles with frequency greater than 1% in the population of South America, North America and Europe were obtained using the dbMHC database. Processing of the MHC class I epitopes were evaluated by MHC I Processing on the IEDB® database and the B lymphocyte epitopes were obtained through the Bcpred and BCTOPE servers. Finally, the antigenicity of the potential targets was analyzed by the VAxiJen server. A total of 1228 proteins were obtained, from which 349 showed no homology with human proteins. For the South American population, among the proteins identified with promiscuous epitopes, we observed proteins that are part of the virulence arsenal of the pathogen such as ROP8, ROP7, ROM4, Cathepsin C / B, rhoptry neck protein and LMBR1 family region protein. In the North American and European populations, we identified common proteins to both populations, such as MIC15, ROP7, HECT-domain (ubiquitin-transferase) domain-containing protein and rhoptry neck protein. ROP31 and subtilisin SUB2 are exclusive to the North American population. These proteins are involved in the invasion process and were shown to be positive in all the parameters adopted in this study. Regarding B lymphocyte epitopes, proteins such as ROP7, ROP8, ROM4, MIC15, HECT were identified. These proteins also presented promiscuous epitopes to class I and II HLAs from the analyzed populations. In addition, MIC2, ROM5, ROP9, MIC8, and MIC9 also showed B lymphocyte epitopes, but MIC9 was noteworthy with the highest score, high expression in the bradyzoite stage, and lack of vaccine test. ROP7, ROP8, ROM4, MIC8 and MIC9 were selected for in vivo and in vitro testing. Thus, our results demonstrate that immunochemical reverse vaccination has been shown not only to identify potential vaccine candidates against pathogens with complex life cycles. / Toxoplasma gondii é o agente etiológico da toxoplasmose congênita, que pode se manifestar como coriorretinite leve, aborto espontâneo, retardo mental, microcefalia, hidrocefalia e convulsões. O tratamento dessa doença é limitado e uma nova vacina representaria a melhor estratégia para a prevenção da infecção. No presente estudo, adotamos a vacinologia reversa associada a imunômica foi aplicada na construção de uma vacina contra T. gondii. Utilizando uma abordagem in silico, selecionamos as proteínas do patógeno que possuem peptídeo sinal e domínio transmembranar utilizando o banco de dados no ToxoDB®. Avaliamos a homologia dessas proteínas com o proteoma humano e predizemos os epítopos utilizando as ferramentas Blastp. NetMHCpan 3.0 e NetMHCIIpan 3.1. Os alelos de HLAs de classe I e II com frequência ≥ 1% na população da América do Sul, América do Norte e Europa foram obtido através do banco de dados dbMHC. O processamento dos epítopos de MHC de classe I foram avaliados pelo MHC I Processing no banco de dados IEDB® e os epítopos de linfócitos B foram obtidos através dos servidores Bcpred e BCTOPE. Por fim, a antigenicidade dos potenciais alvos foi analisada pelo servidor VAxiJen. Um total de 1228 proteínas foi obtido, das quais 349 não apresentaram homologias em humanos. Para a população sul-americana, entre as proteínas com epítopos promíscuos identificadas, observamos proteínas que fazem parte do arsenal de virulência do patógeno tais como ROP8, ROP7, ROM4, cathepsin C/B, rhoptry neck protein e LMBR1 family region protein. Em relação às populações norte-americana e europeia, a identificação de epítopos promíscuos revelou proteínas comums às duas populações tais quais MIC15, ROP7, HECT-domain (ubiquitin-transferase) domain-containing protein e rhoptry neck protein e exclusivas à população norte americana, como ROP31 e subtilisina SUB2. Essas proteínas estão envolvidas no processo de invasão e/ou foram positivas em todos os parâmetros adotados neste estudo. Com relação aos epítopos de linfócitos B, obteve-se 93 proteínas, dentre elas, ROP7, ROP8, ROM4, MIC15, HECT que também apresentaram epítopos promíscuos aos HLAs de classe I e II das populações analisadas. Além delas, MIC2, ROM5, ROP9, MIC8 e MIC9 também apresentaram epítopos de linfócitos B, mas MIC9 destacou-se com o maior score; pela elevada expressão no estágio de bradizoíto e pela inexistência de testes vacinais. ROP7, ROP8, ROM4, MIC8 e MIC9 foram selecionadas para teste in vivo e in vitro. Dessa forma, nossos resultados demonstram que vacinologia reversa associada a imunômica mostrou-se capaz de identificar fortes candidatos vacinais contra patógenos de ciclo vida complexo.
309

Investigação de técnicas de classificação hierárquica para problemas de bioinformática / Investigation of hierarchial classification techniques for bioinformatics problems

Eduardo de Paula Costa 25 March 2008 (has links)
Em Aprendizado de Máquina e Mineração de Dados, muitos dos trabalhos de classificação reportados na literatura envolvem classificação plana (flat classification), em que cada exemplo é associado a uma dentre um conjunto finito (e normalmente pequeno) de classes, todas em um mesmo nível. Entretanto, existem problemas de classificação mais complexos em que as classes a serem preditas podem ser dispostas em uma estrutura hierárquica. Para esses problemas, a utilização de técnicas e conceitos de classificação hierárquica tem se mostrado útil. Uma das linhas de pesquisa com grande potencial para a utilização de tais técnicas é a Bioinformática. Dessa forma, esta dissertação apresenta um estudo envolvendo técnicas de classificação hierárquica aplicadas à predição de classes funcionais de proteínas. No total foram investigados doze algoritmos hierárquicos diferentes, sendo onze deles representantes da abordagem Top-Down, que foi o enfoque da investigação realizada. O outro algoritmo investigado foi o HC4.5, um algoritmo baseado na abordagem Big- Bang. Parte dos algoritmos estudados foram desenvolvidos com base em uma variação da abordagem Top-Down, denominada de Top-Down Ensemble, que foi proposta neste estudo. Alguns do algoritmos baseados nessa nova abordagem apresentaram resultados promissores, superando os resultados dos demais algoritmos. Para avaliação dos resultados, foi utilizada uma medida específica para problemas hierárquicos, denominada taxa de acerto dependente da profundidade. Além dessa, outras três medidas de avaliação foram utilizadas, de modo a comparar os resultados reportados por diferentes medidas / In Machine Learning and Data Mining, most of the research in classification reported in the literature involve flat classification, where each example is assigned to one class out of a finite (and usually small) set of flat classes. Nevertheless, there are more complex classification problems in which the classes to be predicted can be disposed in a hierarchy. In this context, the use of hierarchical classification techniques and concepts have been shown to be useful. One research with great potential is the application of hierarchical classification techniques to Bioinformatics problems. Therefore, this MSc thesis presents a study involving hierarchical classification techniques applied to the prediction of functional classes of proteins. Twelve different algorithms were investigated - eleven of them based on the Top-Down approach, which was the focus of this study. The other investigated algorithm was HC4.5, an algorithm based on the Big-Bang approach. Part of these algorithms are based on a variation of the Top-Down approach, named Top-Down Ensembles, proposed in this study. Some of the algorithms based on this new approach presented promising results, which were better than the results presented by other algorithms. A specific evaluation measure for hierarchical classification, named depth-dependent accuracy, was used to evaluate the classification models. Besides, other three evaluation measures were used in order to compare the results reported by them
310

Desenvolvimento de um algoritmo para identificação e caracterização de cavidades em regiões específicas de estruturas tridimensionais de proteínas / Development of an algorithm to identify and characterize cavities in specific regions of three-dimensional structures of proteins.

Saulo Henrique Pires de Oliveira 25 May 2011 (has links)
A identificação e caracterização geométrica e físico-química de espaços vazios na estrutura tridimensional de proteínas é capaz de agregar informações importantes para guiar o desenho racional de drogas e a caracterização funcional de sítios de ligação e sítios catalíticos. Dessa forma, algumas ferramentas computacionais foram desenvolvidas nas últimas duas décadas, visando efetuar essas caracterizações. Contudo, as ferramentas existentes lidam com uma série de limitações, dais quais merecem destaque a falta de precisão, falta de capacidade de integração em protocolos de larga escala, falta de capacidade de customização e a falta de uma caracterização eletrostática . Tendo em mente estas limitações, desenvolvemos uma nova ferramenta, denominada KV-Finder, com o objetivo de estender as funcionalidades dos programas existentes, fornecendo assim uma caracterização sistemática mais eficiente e mais informativa dos espaços vazios da estrutura tridimensional de proteínas. Através de uma modelagem matricial baseada em um direcionamento realizado pelo usuário, nossa ferramenta identifica e caracteriza espaços vazios em topologias proteicas. O utilitário é capaz de quantificar o volume, a forma, a extensão de sua superfície, os resíduos proteicos que interagem com os espaços vazios e um mapa de cargas parciais da superfície encontrada. Nossa rotina foi integrada com ferramentas gráficas de modelagem molecular, fornecendo uma interação fácil e eficiente com o usuário. A validação de nosso algoritmo foi realizada em um conjunto de proteínas cujos diversos tipos de espaços vazios englobam os mais variados sítios de ligação e sítios catalíticos. O cálculo do volume de cavidades enzimáticas foi efetuado em larga escala, acompanhando a evolução do tamanho de bolsões na superfamília ALDH. Com relação aos outros softwares existentes, nossa ferramenta apresenta uma série de vantagens das quais merecem destaque menor tempo de execução, maior precisão, maior acessibilidade e facilidade de integração com outros programas, além das características únicas de permitir que a busca ocorra em regiões específicas dentro da proteína e de realizar um mapeamento parcial de cargas da superfície encontrada. / The identification and characterization of geometrical and physical-chemical properties in protein vacant spaces aggregates important information for steering rational drug designing and functional characterization of binding and catalytic sites. Therefore, several softwares have been develop during the past two decades in order to perform such characterization. Nevertheless, the existing tools still present a series of limitations such as lack of precision, lack of integrability in large scale protocols, lack of customization capacity and the lack of a proper electrostatic depiction. We developed a new software, dubbed KV-Finder, in order to complement and extend the functionality of existing softwares, providing a systematic and more descriptive portrayal of protein vacant spaces. By employing a user-driven matrix modeling, our tool identifies and characterizes empty spaces in all sorts of protein topologies. The software quantifies the volume, the area and the shape of the surface, the residues that interact with the vacant spaces and a partial charge map of the computed surface. Our routine was integrated with a graphical molecular modeling software, providing the user with a simple and easy-to-use interface. KV-Finder has been validated with a distinct set of proteins and binding sites. The volume computation was carried in large scale, accompanying the evolution of the pocket volume in the ALDH superfamily. Compared with existing software, KV-Finder presents greater precision, greater accessibility and ease of integration in large scale protocols and visualization softwares. Also, the software possesses unique and innovative features such as the ability to segment and subsegment the empty spaces, a electrostatic depiction and a ligand interaction highlight feature.

Page generated in 0.0591 seconds