• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
281

Ferramenta computacional para identificação de micro-organismos com base em assinaturas genômicas

Andrighetti, Tahila [UNESP] 27 February 2015 (has links) (PDF)
Made available in DSpace on 2015-12-10T14:23:05Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-02-27. Added 1 bitstream(s) on 2015-12-10T14:29:19Z : No. of bitstreams: 1 000851881.pdf: 1966900 bytes, checksum: f12318e1992f89b39d28775a2373ebce (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Comunidades microbianas desempenham papéis cruciais em todos ecosistemas da Terra, uma vez que metabolizam compostos essenciais. Essa característica torna importantes alvos de pesquisas em diversas áreas como médica, ambiental, alimentícia e biotecnológica. Entretanto, somente 1% de todas espécies de micro-organismos conhecidos podem ser cultivadas in vitro, dificultando o estudo de suas funções e de sua classificação taxonômica. Com o surgimento de novas tecnologias de sequenciamento, o genoma inteiro de micro-organismos de um habitat pode ser experimentalmente extraído, mas em pequenos fragmentos (¡1500 pb), tornando o processamento dos dados um grande desafio. As ferramentas de análise de metagenômica mais utilizadas classificam as sequências por homologia. Entretanto, o tempo computacional aumenta exponencialmente conforme o tamanho dos fragmentos diminuem. Isso mostra uma necessidade evidente de métodos alternativos que possam analisar dados de metagenômica de maneira rápida e precisa. Esse estudo propõe um novo método de identificação de sequências de bactérias que analisa esses dados. Os genomas de 2164 linhagens de bactérias foram obtidos pelo GenBank e fragmentados em grupos de teste e controle. Cada grupo foi aleatóriamente fragmentado em sequências de 64, 128, 256, 512, 1024, 2048 e 4096 pares de base. As medidas de organização de sequências aplicadas nos fragmentos foram: conteúdo GC, abundância de dinucleotídeos e entropias de dipletes, tripletes e tetrapletes. Foram calculados a média e o desvio padrão dos valores das sequências controle para cada espécie, gênero e família de bactéria. Foram feitas combinações de medidas para classificar as sequências em famílias, gêneros e espécies. A performance da metodologia foi determinada por medidas de sensibilidade, especificidade, precição e média harmônica para conjuntos de... / Microbial communities play a crucial role in all ecosystems on Earth since they metabolize essential compounds. Given this relevant role they are investigated in Medicine, Biotechnology, Ecology, Food Sciences among other fields. However, only 1% of all known micro-organisms species can be cultivated in vitro. The unravelling of their functions and taxonomic classification demands the development of new approaches. With the advent of new sequencing strategies, the entire genome of microrganisms on a given habitat can be experimentally extracted, but the fragments obtained are small (<1500 bps), and the data processing remains a huge challenge. The most used metagenomic analysis tools classify the sequences by homology. However, the computational time grows exponentially as the read length decreases. There is an evident need for alternative methods that can analyze metagenomic data quickly and accurately. This study proposes a new bacteria sequences identification method to be used in metagenomic data. The genomes of 2164 bacterial strains were obtained from the GenBank and distributed into test and control sets. Each group was randomly fragmented into sequences of 64, 128, 256, 512, 1024, 2048, and 4096 base pair. The sequences organization measures applied in the reads were: GC content, dinucleotide abundance and diplets, triplets and tetraplets entropy. The average and standard deviation of the control sequences values of each species, genus and families of bacteria were calculated. Combinations of genomic signatures and entropy were performed allowing classifying bacteria sequences into family, genus and species. The performance of the proposed methodology was determined by measuring sensitivity, specificity, accuracy and harmonic mean for the test set. The results indicated that the GC content presented the best performance among the signatures investigated. We also considered combinations of features, the combination considering GC ... / FAPESP: 2013/1517-4
282

Caracterização funcional e estrutural das proteínas RUV-1 e RUV-2 do fungo Neurospora crassa / Functional and structural characterization of RUV-1 and RUV-2 proteins from the fungus Neurospora crassa

Mateos, Pablo Acera [UNESP] 18 February 2016 (has links)
Submitted by PABLO ACERA MATEOS null (pablo.acera@hotmail.com) on 2016-02-26T21:46:04Z No. of bitstreams: 1 Dissertação Pablo.pdf: 2305687 bytes, checksum: f2605afbab8d002e94ee276992365da9 (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-02-29T14:25:02Z (GMT) No. of bitstreams: 1 mateos_pa_me_araiq.pdf: 2305687 bytes, checksum: f2605afbab8d002e94ee276992365da9 (MD5) / Made available in DSpace on 2016-02-29T14:25:03Z (GMT). No. of bitstreams: 1 mateos_pa_me_araiq.pdf: 2305687 bytes, checksum: f2605afbab8d002e94ee276992365da9 (MD5) Previous issue date: 2016-02-18 / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / Neste trabalho foi realizado um estudo de caracterização das proteínas RUV-1 e RUV-2 de Neurospora crassa, as quais são proteínas ubiquamente encontradas e descritas estar envolvidas em diferentes processos celulares. Resultados anteriores obtidos pelo nosso grupo identificaram, através de espectrometria de massas, a proteína RUV-1 como uma proteína capaz de se ligar ao promotor do gene da glicogênio sintase (gsn) durante a resposta ao choque térmico. Mais tarde, foi demonstrado que a proteína foi capaz de se ligar in vitro, e de maneira especifica, ao motivo de DNA STRE, também presente no promotor gsn. Considerando que a proteína RUV-1 interage com a proteína parceira RUV-2 e, juntas, participam de grandes complexos proteicos que atuam na regulação de diferentes processos celulares, este trabalho teve como objetivo realizar estudos de caracterização das proteínas RUV-1 e RUV-2. Os resultados de expressão gênica mostraram que o gene ruv-1 foi superexpresso na condição de choque térmico e que o gene ruv-2 não mostrou alteração na expressão na mesma condição. Além disso, foi demonstrado que o transcrito do gene ruv-2 é parcialmente processado na situação de choque térmico, e não em outra condição indutora de estresse, através do processo conhecido como intron retention levando à síntese de uma proteína truncada. No entanto, os resultados mostraram que a proteína RUV-2 foi detectada em extratos celulares do fungo obtidos até 4 h de choque térmico. Os cDNAs (ruv-1 e ruv-2) foram inseridos no vetor pET28a e as proteínas expressas em E. coli. Entretanto, ainda não foi finalizada a expressão de ambas utilizando o plasmídeo bicistrônico pETDUET-1, para a análise de interação de ambas proteínas. Neste trabalho também foi construída uma linhagem do fungo modificada geneticamente, a qual produz a proteína RUV-1 fusionada ao tag V5 (RUV-1-V5) e será posteriormente utilizada em ensaio de imunoprecipitação para identificação de proteínas parceiras. Ensaios de imunoprecipatação de cromatina (ChIP) com esta linhagem foram realizados com o objetivo de analisar se a proteína RUV-1 se liga in vivo ao mesmo fragmento de DNA. Entretanto, os experimentos ainda não permitiram identificar a ligação proteína-DNA. Análises de modelagem e dinâmica molecular das proteínas RUV-1 e RUV-2 de N. crassa sugeriram interação entre elas e homologia estrutural a outras proteínas RUV conhecidas / In this work, we performed characterization studies of Neurospora crassa RUV-1 and RUV-2, which are ubiquitous protein and have been described to be involved in different cellular processes. Previous results obtained by our group identified, by mass spectrometry, RUV-1 as a protein able of binding to the glycogen synthase gene promoter (gsn) during heat shock response. Later, it was demonstrated that the protein was able to bind in vitro, and in a specific manner, to the STRE DNA motif, also present in gsn promoter. Since RUV-1 interacts with RUV- 2 protein, and together participate in large protein complexes that act in the regulation of different cellular processes, this study aimed to conduct characterization studies of RUV-1 and RUV- 2 proteins. Gene expression results showed that ruv-1 gene, but not ruv-2 gene was overexpressed under heat shock. Furthermore, it was shown that ruv-2 transcript was incompletely processed under heat shock through a process known as intron retention that leads to the production of a truncated protein. No other stress inducing conditions led to the same phenomenon. However, RUV-2 protein was detected in cell extracts of the fungus exposed to heat shock up to 4 h. The cDNAc (ruv-1 and ruv-2) were inserted into the pET28a vector and the proteins were expressed in E. coli. However, it has not yet been completed the molecular cloning in the bicistronic plasmid pETDUET-1, which allows the production of both proteins in the same cell, what is required for protein-protein interaction analysis. In this work, was also constructed a genetically modified strain, which produces the V5- tagged RUV-1 protein (V5-RUV-1), which that will be later used in immunoprecipitation assay for the identification of partner proteins. Chromatin immunoprecipitation (ChIP) assay using this strain was performed in order to investigate whether RUV-1 protein binds in vivo the DNA fragment from the gsn promoter. Experiments have not allowed the identification of protein-DNA binding yet. Analysis of molecular modelling and dynamics of RUV-1 and RUV-2 proteins suggested the existence of interaction between them and structural homology to other known RUV proteins.
283

Analisando a determinação sexual de vertebrados com base em redes de interação entre proteínas

Valente, Guilherme Targino [UNESP] 21 February 2013 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:14Z (GMT). No. of bitstreams: 0 Previous issue date: 2013-02-21Bitstream added on 2014-06-13T21:03:46Z : No. of bitstreams: 1 000741895.pdf: 15459081 bytes, checksum: d63bdd273032427c5d062ded87237abe (MD5) / Atualmente os sistemas biológicos vem sendo abordados por diversas áreas de pesquisas, dentre elas a biologia de sistemas. Essa área tem centrado esforços para descrever e compreender as relações entre os componentes bióticos e abióticos desses sistemas, utilizando para isso a teoria de grafos. Uma forma de estudar esses sistemas, é avaliar as interações entre proteínas, que são as interações biomoleculares mais abundantes nas células. Nesse contexto, a presente tese focou no desenvolvimento de um algoritmo computacional capaz de predizer interações entre proteínas de qualquer espécie ou conjunto protéico. Para isso, foram utilizadas técnicas de aprendizado de máquina (sub-área da inteligência artificial) para a construção e aplicação desse preditor, o qual mostrou-se eficaz em predizer interações entre proteínas de mais de 80 espécies diferentes, incluindo interações entre proteínas de parasita e hospedeiro. Esse novo preditor foi aplicado no proteoma de zebrafish (Danio rerio) e humanos (Homo sapiens), gerando assim redes de interações proteicas para ambas as espécies. As interações obtidas foram avaliadas em um contexto geral e o foco das análises foi direcionado para a sub-rede relacionada com as vias de determinação e diferenciação sexual em vertebrados. Os resultados demonstraram uma relativa baixa conservação desses grafos ao longo da evolução dos vertebrados, tanto do ponto de vista global quanto da sub-rede relacionada com a determinação e diferenciação sexual em vertebrados. Além disso, foi possível observar ao menos um hub conservado entre as duas sub-redes, o qual representa um novo alvo a ser avaliado por pesquisas experimentais. Contudo, os dados demonstram que o preditor gerado possui um grande potencial para diversas áreas de estudos e é bastante útil para predição de interações em larga-escala. Além disso, os aspectos evolutivos aqui... / Nowadays the biological systems have been analyzed under several research foci, including the system biology. This area focus to describe and understand the relationship between biotic and abiotic factors using the graph theory. The protein interactions are target interactions to the system biology because they are the most abundant biomolecular interactions within a cell. Thus, this thesis reported the development of a computational algorithm to predict proteinprotein interactions for all species or protein sets. The machine learning technique (sub-area of artificial intelligence) were used to develop and apply this method, giving effective results to predict protein-protein interaction for more than 80 different species, including parasitehost associations. This new predictor was applied to the proteome set of zebrafish (Danio rerio) and humans (Homo sapiens), generating the protein-protein interactions for both species. Evolutionary aspects of the protein interactions were studied in a broad context and the focus was directed to the sub-network involved in the vertebrate sex determination and differentiation. The results reported a low conservation of those graphs across the evolution in a general view or for the sub-network related to the vertebrate sex determination and differentiation. Moreover, it was reported at least one conserved hub between both subnetworks, to be further evaluated by experimental procedures. Anyway, the data showed that the predictor here reported may be very useful for several research areas and it is desirable for large-scale prediction procedures. Furthermore, the evolutionary aspects discussed in this thesis open new perspectives concerning system biology and evolutionary pathways of vertebrate sex determination and differentiation
284

Análise automatizada em géis de eletroforese unidimensionais utilizando técnicas de processamento de imagens - AAGEU

Joanico, William Rodrigo January 2012 (has links)
Orientadora : Profª Drª Iris Hass / Co-orientador : Prof. Dr. Lucas Ferrari de Oliveira / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 23/02/2012 / Bibliografia: fls.81-85 / Resumo: Este trabalho apresenta uma abordagem computacional automatizada para realizar a detecção de estruturas pertencentes às imagens de géis de eletroforese unidimensionais, como colunas e marcadores. Foi desenvolvido um algoritmo em linguagem C, com auxílio da biblioteca OpenCV para processar as imagens. As imagens foram submetidas a uma fase de pré-processamento com recortes, alinhamentos e aplicação de um filtro bi-lateral. A metodologia abordada para detectar o marcador fez uso da imagem segmentada e da informação contida em cada coluna. No caso da obtenção das colunas a imagem binarizada passou por um processo de abertura morfológica e em seguida cada coluna foi representada por um vetor e baseado em seu conteúdo delimitadas as colunas. Os resultados demonstram que a metodologia utilizada é válida, e que através de técnicas simples é possível resolver o problema, sem a necessidade de se desenvolver ou utilizar técnicas mais complexas ou altamente custosas computacionalmente. A técnica obteve 73% de acertos na identificação do marcador, com base nos testes realizados e as dificuldades encontradas estavam relacionadas com o contraste e a presença de ruídos e manchas em algumas imagens. No caso do algoritmo para a identificação das colunas, a técnica alcançou 82% de acertos e foi possível notar que o algoritmo conseguiu identificar todas ou pelo menos a maior parte das colunas que estavam presentes nas imagens, e esse sucesso foi devido aos poços estarem alinhados e as imagens possuírem boa qualidade, assim evidenciando suas informações. / Abstract: This paper presents a computational approach to perform automated detection of structures belonging to the images of one-dimensional gels electrophoresis like pillars and markers. We developed an algorithm in C language with the aid of the OpenCV library to process the images. The images were submitted to a phase of preprocessing with cutouts, alignments and applying a filter bi-lateral. The methodology discussed to detect the marker made use of the segmented image and the information contained in each column. In the case of columns to obtain the binarized image has undergone a process of morphological opening and then each column is represented by a vector-based and content-defined columns. The results show that the methodology is valid, and that simple techniques can solve the problem without the need to develop or use more complex techniques or highly expensive computationally. The technique achieved 73% accuracy in identifying marker, based on tests and the difficulties encountered were related to the contrast and the presence of noise and spots on some images. Under Algorithm for the identification of columns, the technique reached 82% of correct answers and was possible to notice that the algorithm able to identify all or at least most columns that were present in images, and that success was due to the wells being aligned and the images were good quality, so showing your information
285

Desintegrinas de Bothrops alternatus: biologia molecular, estudos in vitro, in vivo e bioinformática estrutural.

Ramos, Oscar Henrique Pereira 28 November 2005 (has links)
Made available in DSpace on 2016-06-02T20:20:26Z (GMT). No. of bitstreams: 1 TeseOHPR.pdf: 2711129 bytes, checksum: 49ae21bbb3bc42024664100735c042db (MD5) Previous issue date: 2005-11-28 / Universidade Federal de Minas Gerais / Disintegrins are toxins frequently found in snake venoms. Their biological effects are due to their binding to cell receptors known as integrins. Aiming to isolate new disintegrins from Bothrops alternatus snake, a cDNA library was constructed upon the transcripts expressed in the venom gland from one specimen. Two disintegrins, called DisBa-01 and DisBa-02 were cloned and sequenced. The amplification of other medium-size disintegrins and metalloprotease-disintegrins was also achieved. The recombinant toxin, DisBa-01, was expressed in an optimized bacterial system (Escherichia coli BL21(DE3) pET28a+DisBa-01) and tested in several biological assays. The toxin inhibited the platelet aggregation (IC50= 235nM) induced by collagen in rabbit s platelets rich plasma (PRP). Using ADP as inductor, the platelet aggregation inhibition was also observed in PRP from rabbits (IC50= 124nM) and human (IC50= 475nM), as well as in washed platelets from mice (IC50= 25nM). Competition assays for the &#945;IIb&#946;3 integrin using specific ligands, fibrinogen and a specific antibody against activated &#945;IIb&#946;3, revealed that the toxin strongly binds to this receptor (respectively IC50=18nM and IC50=70nM). Furthermore, the toxin inhibited the proliferation of cells that representatively express &#945;V&#946;3 integrin, HMEC-1 and B16F10-2B8, in a dose/time dependent manner and the adhesion of B16F10-2B8 to vitronectin (IC50= 225nM). In vivo, the toxin significantly inhibited the thrombus formation in arterioles (Treated: 58,4 ± 1,6 min.; Control: 24,3 ± 2,8 min., p<0,002) and venules (Treated: 46,6 ± 6,8min.; Control: 27,1 ± 1,3min., p<0,002), prolonged the bleeding time (Treated: 989 ± 140 sec.; Control: 202 ± 22 sec.; p<0,008) and inhibited the pulmonary mestastasis of B16F10-2B8 (~92%, 12 days after the tumor cells injection). These results, as well as structural bioinformatics studies strongly suggest the binding of the toxin with &#945;IIb&#946;3 and &#945;Vb3 integrins, what motivates further studies aiming the therapeutic/laboratorial application of DisBa-01 or its derivatives. / Desintegrinas são toxinas frequentemente encontradas em venenos de serpentes e cujos efeitos biológicos relacionam-se com suas ligações a receptores celulares conhecidos como integrinas. Visando o isolamento de novas desintegrinas da serpente Bothrops alternatus, foi construída uma biblioteca de cDNA a partir de transcritos presentes nas glândulas veneníferas de um espécime dessa serpente. Duas desintegrinas, denominadas DisBa-01 e DisBa-02, foram clonadas e seqüenciadas. Também foi possível a amplificação de outras prováveis desintegrinas médias e metaloproteases-desintegrinas. A desintegrina, DisBa-01, foi expressa em um sistema bacteriano otimizado (Escherichia coli BL21(DE3) pET28a+DisBa-01) e testada em uma série de ensaios biológicos. A toxina recombinante inibiu a agregação plaquetária induzida por colágeno em plasma rico em plaquetas (PRP) de coelhos (IC50= 235nM). Utilizando ADP como indutor também se constatou a inibição da agregação plaquetárias em PRP de coelho (IC50= 124nM) e humano (IC50= 475nM), além da inibição da agregação de plaquetas lavadas de camundongos (IC50= 25nM). Em ensaios de competição pela da integrina &#945;IIb&#946;3 na presença de ligantes específicos, obteve-se os IC50s de 18 e 70nM, respectivamente, para o fibrinogênio e para um anticorpo específico contra a integrina ativada. A toxina inibiu ainda a proliferação de células com expressão mais representativa de integrina &#945;V&#946;3, HMEC-1 e B16F10-2B8, de maneira dose/tempo dependente, bem como adesão de células B16F10-2B8 à vitronectina (IC50= 225nM). In vivo, a toxina significativamente inibiu a formação de trombos em arteríolas (Experimental: 58,4 ± 1,6 min; Controle: 24,3 ± 2,8 min, p<0,002) e vênulas (Experimental: 46,6 ± 6,8min.; Controle: 27,1 ± 1,3min., p<0,002), prolongou o tempo de sangramento (Experimental: 989 ± 140 segundos; Controle: 202 ± 22 segundos; p<0,008) e inibiu a formação de metástases pulmonares (~92% no 12° dia após a injeção das células tumorais). Os resultados obtidos somados a estudos por bioinformática estrutural sugerem fortemente a ligação com integrinas como a &#945;IIb&#946;3 e &#945;Vb3, motivando o prosseguimento de estudos visando a aplicação terapêutica e/ou laboratorial da DisBa-01 ou possíveis derivados.
286

Alinhamento de seqüências biológicas com o uso de algoritmos genéticos.

Ogata, Sabrina Oliveira 14 March 2005 (has links)
Made available in DSpace on 2016-06-02T20:21:33Z (GMT). No. of bitstreams: 1 DissSOO.pdf: 370558 bytes, checksum: eaf0bc7ee24eeffcd23041e4273aa013 (MD5) Previous issue date: 2005-03-14 / Universidade Federal de Sao Carlos / The comparison of genome sequences from different organisms is one of the computational application most frequently used by molecular biologists. This operation serves as support for other processes as, for instance, the determination of the three- dimensional structure of the proteins. During the last years, a significative increase has been observed in the use of Genetic Algorithms (GA) for optimization problems as, for example, dna or protein sequence alignment. GAs are search techniques inspired in mechanisms from Natural Selection and Genetics. In this work, a GA was used to development a computacional tool for the sequence alignment problem. A benchmark comparison of this program with the bl2seq tool (from Blast package) is showed using some sequences, varying in similarity and length. In some cases the GA overhelmed the bl2seq tool. This work contributes to the Bioinformatic field by the use of a novel methodology that can use as an option for sequence analysis in genome projects and to enhance the results of other tools such like Blast. / A comparação de seqüências de genomas de organismos é uma das aplicações computacionais mais utilizadas por biólogos moleculares. Esta operação serve de suporte para outros processos como, por exemplo, a determinação da estrutura tridimensional de proteínas. Durante os últimos anos, tem- se observado uma grande expansão na utilização de Algoritmos Evolutivos, especialmente Algoritmos Genéticos (AGs), para problemas de otimização, como os de alinhamento de seqüências de dna e proteínas. Os AGs são técnicas de busca inspiradas em mecanismos de seleção natural e da genética. Neste trabalho, um AG foi utilizado para o desenvolvimento de uma ferramenta computacional para o problema de alinhamento de pares de seqüências. Uma comparação foi realizada com o uso da ferramenta bl2seq (do pacote de ferramentas Blast) afim de se checar a desempenho do AG. Utilizou- se para isso seqüências de diversos tamanhos e graus de similaridade. Os resultados demonstraram alguns casos específicos onde o AG superou a ferramenta bl2seq. A principal contribuição deste trabalho está na área de Bioinformática, com o emprego de uma nova metodologia, que posteriormente possa ser utilizada como mais uma opção para análises de seqüências em projetos genomas e para refinamento dos resultados obtidos por outras ferramentas usualmente utilizadas, como o Blast.
287

Obtención de un Clasificador Optimo para la Evaluación de la Calidad de Modelos Tridimensionales de Proteínas

Vergara Correa, Ismael Alfonso January 2008 (has links)
Uno de los problemas esenciales en la predicción computacional de la estructura tridimensional de proteínas corresponde a la evaluación de la calidad de un modelo proteico generado computacionalmente, esto es, clasificar cada modelo proteico en correcto o incorrecto. Este problema toma especial importancia cuando los modelos son generados por software automatizados a gran escala. La mayoría de los métodos existentes para la evaluación de los modelos proteicos están basados en variables únicas que actúan como los clasificadores. La variable consistente en la energía libre total del sistema es aquella de mejor rendimiento cuando se le compara a otras variables o atributos del modelo proteico. Sin embargo, clasificadores multivariables basados en una serie de propiedades físicas, geométricas y estadísticas pueden mostrar un rendimiento significativamente mayor con respecto a los clasificadores de una variable, sobre todo para los casos más difíciles que corresponden a proteínas pequeñas y cuyo modelo obtenido computacionalmente es incompleto. En el presente trabajo de tesis, se calcularon un total de 31 variables sobre un conjunto de modelos proteicos correctos e incorrectos generados con la técnica de modelado comparativo. Estas variables corresponden a propiedades del alineamiento secuenciaestructura entre la secuencia a modelar y la estructura molde, propiedades del modelo proteico generado, propiedades de la región del molde efectivamente utilizada para generar el modelo, y propiedades del molde completo utilizado para generar el modelo proteico. El conjunto de datos se dividió en conjuntos de entrenamiento, validación y de prueba. Se aplicaron distintos métodos de ranking, selección y extracción de variables para filtrar redundancia y maximizar la relevancia de las variables con respecto a la clase respuesta. Luego, se aplicaron diferentes algoritmos de aprendizaje tales como redes bayesianas, máquinas de vectores de soporte, perceptrón multicapa y algoritmos genéticos con el fin de obtener clasificadores multivariables para el problema de la clasificación de un modelo en correcto e incorrecto. El rendimiento de cada clasificador multivariable, así como el rendimiento de cada variable única utilizada como clasificador, fue comparado con el rendimiento de los otros clasificadores con el fin de declarar a uno de ellos como aquél óptimo para el problema de la evaluación de la calidad de modelos proteicos generados computacionalmente. El clasificador óptimo obtenido en este trabajo, generado con el algoritmo de aprendizaje de máquinas de vectores de soporte, presenta un aumento en el rendimiento de un 13% con respecto a los mejores clasificadores univariables.
288

Formalização de uma linguagem visual para descrição de sistemas biológicos / Formalization of a visual language to specify biological pathways

Medrado, Ramon Gomes January 2009 (has links)
Vias biológicas representam interações entre entidades químicas complexas (proteínas, substratos, metabólitos etc.) que ocorrem no nível molecular das células. A representação e compreensão do comportamento destas vias é o principal alvo de estudos da Biologia Sistêmica. Esta área de estudos envolve a construção de modelos matemáticos que possam simular in silico (computacionalmente) o comportamento destes sistemas biológicos verificados in vivo (experimentalmente). Do ponto de vista computacional é evidente que tais sistemas são complexos para abordar e descrever de modo intuitivo. São necessários modelos com valor preditivo, isto é, que permitam descrever os comportamentos do sistema que são experimentalmente verificáveis. Algumas notações gráficas foram propostas para descrever vias biológicas. Entre elas, os diagramas de processos tem sido amplamente utilizados. Um diagrama de processos é essencialmente um grafo no qual vértices e arestas representam componentes biológicos, e há uma notação gráfica associada com cada elemento. Nesta dissertação propomos uma fundamentação formal para a linguagem dos diagramas de processos definindo a sintaxe usando gramática de grafos. Nós definimos primeiramente um grafo chamado BioProc, descrevendo o meta-modelo dos diagramas de processos. Instâncias do grafo BioProc são portanto diagramas de processos modelando vias biológicas. Para descrever a semântica foi proposta uma tradução algébrica dos grafos BioProc para redes de Petri estocásticas generalizadas (GSPNs) já amplamente utilizadas na modelagem de processos biológicos. O uso de gramática de grafos como formalismo intermediário na tradução habilita a verificação sintática da via com a checagem dos tipos válidos que podem ser definidos para cada reação antes da simulação na rede de Petri e usá-las posteriormente para explorar propriedades estruturais e estocásticas do modelo. Além disso serve como base para a evolução do modelo proposto. Isto é relevante já que modelos frequentemente são construídos incrementalmente para se adaptar a novos requisitos e/ou incluir novas características. / Biological pathways represent interactions between complex chemical entities (proteins, substrates, metabolites, etc.) that occur at the molecular level of cells. The representation and comprehension of biological pathways behavior is the main target of research in the field of Systems Biology. This area investigates the construction of mathematical models that can simulate in silico (computationally) the behavior of biological systems checked in vivo (experimentally). From a computational view point it is clear that such systems are too complex to analyze and describe in an intuitiveway. Models with predictive value are needed, describing the behaviors that are experimentally verifiable. There are some graphical notations to describe biological pathways. Among them, process diagrams have been widely used. A process diagram is essentially a graph in which vertices and edges represent biological components, and there is a graphical notation associated with each element. In this master thesis we give a formal foundation for biological process diagrams, by defining their (concrete and abstract) syntax and semantics using a formalism called graph grammars. We first build a graph called BioProc Graph, describing the meta-model of process diagrams. Instances of this BioProc graph are concrete process diagrams modeling biological pathways. To describe the semantics we proposed a translation of BioProc diagrams to generalized stochastic Petri networks (GSPNs) already widely used in modeling biological processes. The use of graph grammar formalism as a basis for translation enables the syntatic verification to check the valid types that can be defined for each reaction after the simulation of Petri net and before that to explore structural and stochastic properties of the model. In addition it serves as the basis for model evolution proposed. This is relevant because models are often built incrementally to adapt to new requirements and/or include new features.
289

Arquitetura neural para controle da locomoção de um robô quadrúpede baseada em referências biológicas / Neural Architecture for the Locomotion Control of a Quadruped Robot Based on Biological References

Basso, Daniel Monteiro January 2005 (has links)
A natureza é uma fonte inesgotável de soluções elegantes para os mais diversos problemas, da aparente simplicidade do formato do ovo, que garante maior segurança ao organismo em desenvolvimento, à evidente complexidade do sistema nervoso humano, que é capaz de pensar sobre problemas e encontrar soluções para eles. Neste trabalho foram aplicados modelos computacionais inspirados em estudos neurológicos para a realização da locomoção de um robô quadrúpede. O corpo do robô foi simulado, permitindo incorporar características mais semelhantes às de um animal do que seria possível com um robô de verdade, como grande quantidade de articulações e força dos motores. A arquitetura neural responsável pelo controle do robô teve como referência para seu desenvolvimento os Geradores Centrais de Padrões, que são circuitos neurais capazes de gerar a seqüência de ativações musculares envolvidas em diversos movimentos rítmicos, como respirar e caminhar, e estão em sua maioria localizados na medula espinhal. Para compor esta rede foi usado um modelo de neurônio com algumas propriedades encontradas em um neurônio real, como a capacidade de inibir a ativação de outros neurônios, e outras puramente matemáticas, tornando-o uma ferramenta versátil para incorporar a funcionalidade de outros modelos de neurônios e de redes neurais. Trabalhos futuros farão uso dos resultados desta pesquisa como base para abordar temas mais complexos, como planejamento motor e tomada de decisão. / Nature is an endless source of elegant solutions to every kind of problem, from the seeming simplicity of the egg’s shape, which assures a safer environment to the developing organism, to the evident complexity of the human nervous system, which is capable of thinking about problems and finding solutions to them. In this work some computational models inspired on neurological research were applied to achieve the locomotion of a quadruped robot. The robot’s body was simulated, allowing to have features more similar to their animal counterparts than would be possible using a real robot, such as the high amount of articulations and the motors’ strength. The neural architecture responsible for the robot’s control was developed using Central Pattern Generators as reference, which are neural circuits capable of generating the sequence of muscle activations involved in a variety of rhythmic movements, such as breathing and walking, and are mostly located in the spine. To assemble this network a neuron model was used which has some properties found on a real neuron, as the ability to inhibit other neurons’ activation, and others purely mathematical, making it a versatile tool to incorporate the functionality of other neuron and neural networks models. Future works will make use of these research’s results as a base to approach more complex problems, such as motor planning and decision making.
290

Identificação de snoRNAs usando aprendizagem de máquina

Oliveira, João Victor de Araujo 29 January 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2016. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2016-08-03T13:45:05Z No. of bitstreams: 1 2016_JoaoVictorAraujoOliveira.pdf: 3385598 bytes, checksum: 87023d9eae07bd39a3d1cb8613c3d33f (MD5) / Approved for entry into archive by Patrícia Nunes da Silva(patricia@bce.unb.br) on 2016-12-06T13:01:15Z (GMT) No. of bitstreams: 1 2016_JoaoVictorAraujoOliveira.pdf: 3385598 bytes, checksum: 87023d9eae07bd39a3d1cb8613c3d33f (MD5) / Made available in DSpace on 2016-12-06T13:01:15Z (GMT). No. of bitstreams: 1 2016_JoaoVictorAraujoOliveira.pdf: 3385598 bytes, checksum: 87023d9eae07bd39a3d1cb8613c3d33f (MD5) / Métodos de aprendizagem de máquina vêm sendo amplamente usados na identificação e classificação de diferentes famílias de RNAs não-codificadores (ncRNAs). Muitos desses métodos são baseados na aprendizagem supervisionada, onde atributos anteriormente conhecidos, chamados features, são extraídos de uma sequência e usados em um classificador. Nesta dissertação, apresentamos dois métodos para a identificação das duas classes principais de snoRNAs, C/D box e H/ACA box snoRNAs: snoReport 2.0, uma melhoria significativa da primeira versão do snoReport; e o snoRNA-EDeN, um novo método baseado no EDeN, que é um kernel decomposicional de grafos. O snoReport 2.0 é um método que, usando features extraídas de sequências candidatas em genomas, combina predição de estrutura secundária de ncRNAs com Máquina de Vetores de Suporte (Support Vector Machine - SVM), para identificar C/D box e H/ACA box snoRNAs. Seu classificador de H/ACA box snoRNA mostrou um F-score de 93% (uma melhoria de 10% em relação à primeira versão do snoReport), enquanto o classificador de C/D box snoRNA obteve F-score de 94% (melhoria de 14%). Alem disso, ambos os classificadores tiveram todas as medidas de performances acima de 90%. Na fase de validação, o snoReport 2.0 identificou 67,43% dos snoRNAs de vertebrados de ambas as classes. Em Nematóides, o snoReport 2.0 identificou 29,6% dos C/D box snoRNAs e 69% dos H/ACA box snoRNAs. Para as Drosofilídeas, foram identificados 3,2% dos C/D box snoRNAs e 76,7% dos H/ACA box snoRNAs. Esses resultados mostram que o snoReport 2.0 é eficiente na identificação de snoRNAs em organismos vertebrados, e também para H/ACA box snoRNAs de organismos invertebrados. Por outro lado, em vez de usar features de uma sequência (em geral, difíceis de identificar), uma abordagem recente de aprendizagem de máquina é descrita a seguir. Dada uma região de interesse de uma sequencia, o objetivo é gerar um vetor esparso que pode ser usado como micro-features em algum algoritmo de aprendizado de máquina, ou pode ser usado para a criação de features poderosas. Essa abordagem é usada no EDeN (Explicit Decomposition with Neighbourhoods), um kernel decomposicional de grafos baseado na técnica Neighborhood Subgraph Pairwise Distance Kernel (NSPDK). O EDeN transforma um grafo em um vetor esparso, decompondo-o em todos os pares de subgrafos vizinhos de raios pequenos, a distâncias crescentes. Baseado no EDeN, foi desenvolvido um método chamado snoRNA-EDeN. Na fase de testes, para C/D box snoRNAs, o snoRNA-EDeN obteve um F-score de 93,4%, enquanto que para H/ACA box snoRNAs o F-score foi de 85.12%. Na fase de validação, para C/D box snoRNA, o snoRNA-EDeN mostrou uma grande capacidade de generalização, identificando 94,61% de snoRNAs de vertebrados e 63,52% de invertebrados, um resultado significantemente melhor em comparação ao snoReport 2.0, que identificou apenas 52,92% dos vertebrados e 14,6% dos invertebrados. Para o H/ACA box, o snoReport 2.0 identificou 79,9% dos snoRNAs de vertebrados e 73,3% dos snoRNAs de Nematóides e Drosofilídeos, enquanto que o snoRNA-EDeN identificou 95,4% dos vertebrados e 57.8% dos nematóides e drosofilas. Ambos os métodos estão disponíveis em: http://www.biomol.unb.br/snoreport e http://www.biomol.unb.br/snorna_eden. ___________________________________________________________________________ ABSTRACT / Machine learning methods have been widely used to identify and classify different families of non-coding RNAs. Many of these methods are based on supervised learning, where some previous known attributes, called features, are extracted from a sequence, and then used in a classifier. In this work, we present two methods to identify the two main classes of snoRNAs, C/D box and H/ACA box: snoReport 2.0, a significant improvement of the original snoReport version; and snoRNA-EDeN, a new method based on EDeN, a decompositional graph kernel. On one hand, snoReport 2.0 is a method that, using features extracted from candidate sequences in genomes, combines secondary structure prediction with Support Vector Machine (SVM) to identify C/D box and H/ACA box snoRNAs. H/ACA box snoRNA classifier showed a F-score of 93% (an improvement of 10% regarding to the previous version), while C/D box snoRNA classifier a F-Score of 94% (improvement of 14%). Besides, both classifiers exhibited performance measures above 90%. In the validation phase, snoReport 2.0 predicted 67.43% of vertebrate organisms for both classes. SnoReport 2.0 predicted: for Nematodes, 29.6% of C/D box and 69% of H/ACA box snoRNAs; and for Drosophilids, 3.2% of C/D box and 76.7% of H/ACA box snoRNAs. These results show that snoReport 2.0 is efficient to identify snoRNAs in vertebrates, and also H/ACA box snoRNAs in invertebrates organisms. On the other hand, instead of using known features from a sequence (difficult to find in general), a recent approach in machine learning is described as follows. Given a region of interest of a sequence, the objective is to generate a sparse vector that can be used as micro-features in a specific machine learning algorithm, or it can be used to create powerful features. This approach is used in EDeN (Explicit Decomposition with Neighbourhoods), a decompositional graph kernel based on Neighborhood Subgraph Pairwise Distance Kernel (NSPDK). EDeN transforms one graph in a sparse vector, decomposing it in all pairs of neighborhood subgraphs of small radius at increasing distances. Based on EDeN, we developed a method called snoRNA-EDeN. On the test phase, for C/D box snoRNAs, snoRNA-EDeN showed a F-score of 93.4%, while for H/ACA box snoRNAs, the F-score was 72%. On the validation phase, for C/D box snoRNAs, snoRNA-EDeN showed a better capacity of generalization, predicting 94.61% of vertebrate C/D box snoRNAs and 63.52% of invertebrates, a significantly better result compared to snoReport 2.0, which predicted only 52.92% of vertebrates and 14.6% of invertebrates. For H/ACA box snoRNAs, snoReport 2.0 predicted 79.9% of vertebrate snoRNAs and 73.3% of Nematode and Drosophilid sequences, while snoRNA-EDeN predicted 95.4% of vertebrate snoRNAs and 57.8% of Nematode and Drosophilid sequences. Both methods are available at http://www.biomol.unb.br/snoreport and http://www.biomol.unb.br/snorna_eden.

Page generated in 0.0624 seconds