• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
181

Perseus:uma nova técnica para tratar árvores de sufixo persistentes / Perseus: a novel technique to handle persistent suffix trees

Caio Cesar Mori Carelo 31 August 2009 (has links)
O avanço tecnológico dos laboratórios de biologia molecular tem proporcionado um grande aumento no volume de seqüências de nucleotídeos armazenadas em bancos de dados biológicos, introduzindo o desafio de pesquisar eficientemente estes dados. Neste contexto, a árvore de sufixo é um método de acesso utilizado por muitas aplicações que envolvem pesquisa em dados biológicos. Entretanto, o custo de construção das árvores de sufixo é alto devido ao tamanho da estrutura de indexação gerado e à necessidade da árvore de sufixo caber em memória principal para ser construída com complexidade linear em relação ao tempo. Esta dissertação propõe o Perseus, uma nova técnica para tratar árvores de sufixo persistentes. A técnica Perseus apresenta os seguintes diferenciais. Ela introduz uma abordagem que realiza a construção de árvores de sufixo persistentes cujos tamanhos podem exceder a capacidade da memória principal. Além disso, ela provê um algoritmo que constrói árvores de sufixo por meio do particionamento destas árvores somente quando necessário. Esta construção também permite que o usuário escolha quais subseqüências de uma seqüência devem ser indexadas, de acordo com os requisitos particulares de suas aplicações. Por fim, a técnica proposta também introduz um algoritmo de casamento exato que permite a busca por uma seqüência de consulta em árvores de sufixo que podem estar particionadas. A validação do Perseus foi realizada por meio de testes de desempenho considerando genomas de vários organismos, os quais possuem diferentes ordens de magnitude de tamanho. Os resultados obtidos foram comparados com a técnica Trellis+, a qual representa o estado da arte nesta linha de pesquisa. Os testes indicaram que o Perseus construiu árvores de sufixo mais rapidamente do que o Trellis+, reduzindo o tempo total gasto na construção em até 24%. Perseus também criou árvores de sufixo mais compactas, atingindo uma redução média de 27% no espaço de memória secundária utilizado. Já com relação ao tempo total gasto no processamento de consultas, Perseus sempre produziu os melhores resultados, respondendo consultas em média 49% mais rápido do que o seu principal concorrente. Com relação à indexação de subseqüências escolhidas pelo usuário, comparando os resultados obtidos com o Trellis+, os testes mostraram que Perseus proveu uma redução no tempo de construção de árvores de sufixo de 97% na média e uma redução no tempo gasto no processamento de consultas de genes de 93% na média / Due to the technological advances in molecular biology laboratories, biological databases are extremely voluminous and tend to become more voluminous as data on new genome organisms are available. This introduces the challenge of searching nucleotide sequences efficiently. The suffix tree is an access method used for several applications that search for these data. However, the cost of building suffix trees is high, since they are extremely large data structures and they should fit in the main memory to be constructed in linear time. In this masters thesis, we propose the Perseus, a novel technique that handles persistent suffix trees. The Perseus introduces the following distinctive good properties. It is based on an approach that constructs persistent suffix trees whose sizes may exceed the main memory capacity. Furthermore, it provides an algorithm that allows for users to indicate which substrings of the input string should be indexed, according to the requirements of their applications. Moreover, it proposes an extended exact matching algorithm that searches for a query string into suffix trees that may be partitioned. The Perseus was validated through performance tests using genomes of several organisms of different sizes. The results were compared with the Trellis+ technique, which represents the state-of-the-art in this field. The tests showed that the Perseus reduced the time spent on constructing suffix trees by 24%. The Perseus also constructed compacter suffix trees, providing an average reduction in the secondary memory storage of 27%. Furthermore, the Perseus reduced the time spent on query processing of nucleotide sequences by up to 49%. As for the functionality of indexing substrings according to the users requirements, the Perseus greatly improved the query performance in comparison to the Trellis+. The results showed that the Perseus reduced the time spent on constructing suffix trees by 97% on average and the time spent on query processing of genes by 93% on average
182

Análise computacional de genes associados ao metabolismo de fixação de nitrogênio no feijão-caupi (Vigna unguiculata) e cana-de-açúcar (Saccharum spp.)

Souto Vieira de mello, Gabriela 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T18:02:25Z (GMT). No. of bitstreams: 2 arquivo3643_1.pdf: 2694138 bytes, checksum: 794a94d7f15d2fde9b79a3808d3c4fc6 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A fixação biológica de nitrogênio tem sido um dos principais focos de interesse no que se refere à nutrição mineral vegetal, sendo explorada na agricultura como uma fonte ecologicamente benigna de nitrogênio, além de reduzir o uso de fertilizantes químicos, que aumentam o custo da produção e causam danos ao meio ambiente. Nesse contexto, destacase a relação simbiótica entre bactérias da família Rhizobiaceae e raízes de leguminosas que permitem à planta, através dos nódulos radiculares, a absorção do nitrogênio fornecida pela bactéria, enquanto esta faz uso dos fotossintatos e de um ambiente microaeróbico fornecido pela planta. Esse trabalho teve como objetivo identificar, através de ferramentas computacionais, seqüências dos genes que participam da fixação de nitrogênio (NORK, DMI3, NIN, NSP1, Anexina, CCS52a, ENOD40, ENOD8, NOD26, DMT1, NOD70, Glutamina sintase, Leghemoglobina, NOD35 e Sucrose sintase) nos transcriptomas de Vigna unguiculata e de Saccharum officinarum. Foi possível a identificação de 263 ortólogos às nodulinas estudadas no transcriptoma do feijão-caupi, com destaque para as Leghemoglobinas que corresponderam a 95% dos clusters identificados. Com relação aos genes estudados na cana-de-açúcar, foram observados 195 clusters ortólogos, apresentando em sua maioria uma alta similaridade com nodulinas de outras monocotiledôneas. De uma forma geral, o estudo pôde constatar a presença das nodulinas em todos os tecidos analisados, com diferentes níveis de expressão. A maioria dos transcritos se encontrava nas bibliotecas de folhas infectadas e de raiz sob estresse salino no caso do caupi e em flores e raízes no caso da cana. Quando analisadas através de alinhamentos múltiplos, as nodulinas oriundas de diferentes organismos e aquelas encontradas no caupi apresentaram maior semelhança entre espécies pertencentes à mesma classe. Com relação às Angiospermas em geral, a família Fabaceae foi separada do restante, confirmando a função divergente e especifica destes genes no grupo. Os resultados do presente estudo sugerem o envolvimento das nodulinas em vias amplamente conservadas do desenvolvimento vegetal, confirmando o papel multifuncional desses genes além da interação benéfica com microorganismos. De uma forma geral, esse trabalho tem potencial para colaborar com o desenvolvimento de marcadores moleculares para o melhoramento das espécies estudadas, assim como para o entendimento da abundância, diversidade e evolução destes genes. O estudo pode ainda fornecer meios de elucidar os mecanismos envolvendo esses genes em outras vias, que não a de fixação, promovendo não só o controle adicional desses processos, como também uma possível expansão dessa vantajosa relação para plantas nãoleguminosas de importância econômica
183

Estudo in silico de genes que codificam fatores de transcrição responsivos à seca, salinidade e congelamento nos genomas do eucalipto, cana e arroz

da Mota Soares Cavalcanti, Nina January 2007 (has links)
Made available in DSpace on 2014-06-12T18:04:27Z (GMT). No. of bitstreams: 2 arquivo6196_1.pdf: 2969003 bytes, checksum: 8f50bcbdb2b65d6db740defdd69758a0 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2007 / Estresses abióticos são os principais responsáveis por provocar alterações no crescimento e desenvolvimento vegetal. As plantas, em contrapartida, lançam mão de uma variedade de respostas a fim de manter seus processos metabólicos e fisiológicos. Uma das principais respostas das plantas às alterações das condições ambientais é a regulação adicional da expressão. Além desta, são de grande importância a síntese de osmoprotetores, transportadores iônicos, chaperonas, proteínas de choque térmico, aquaporinas, proteínas LEA, entre outras. Este trabalho buscou identificar genes que codificam fatores de transcrição (DREB, ERF, MYB, bHLH, bZIP, HSF, WRKY, NAC, ZincFinger e Homeodomínio) em eucalipto, cana-de-açúcar e arroz através de ferramentas in silico. Os resultados obtidos revelaram a presença de fatores de transcrição em todos os genomas estudados, revelando a importância dos mesmos nas respostas aos estresses abióticos. De uma forma geral, as proteínas pertencentes à uma mesma família mostraram características (ponto isoelétrico e massa molecular) bastante similares, indicando o alto grau de conservação das mesmas. Os dendrogramas gerados refletiram uma relação muito mais adaptativa do que filogenética entre os organismos. Além disso, também a estrutura gênica parece ser conservada em eucalipto e cana, como observado nas análises comparativas entre as ORFs destas culturas e as de seqüências genômicas de Arabidopsis e Oryza sativa. O padrão de expressão encontrado reflete o envolvimento destes fatores tanto no estresse biótico, quanto no estresse abiótico, com grande número de transcritos em tecidos infectados por bactérias, caule, raiz e região de transição raiz-caule. Em suma, os resultados apontam para a conservação dos principais mecanismos de controle da transcrição envolvidos na resistência/tolerância aos estresses, como a seca, salinidade e congelamento, em eucalipto, cana e arroz. No entanto, estudos adicionais, in vivo e in vitro, darão maiores subsídios para o melhor esclarecimento da funcionalidade destas proteínas e das vias em que participam estes genes
184

Marcadores moleculares para identificação de espécies da fauna brasileira: ferramentas para inibição da caça predatória no Brasil

FERREIRA, Paula Braga 31 January 2011 (has links)
Made available in DSpace on 2014-06-12T23:13:47Z (GMT). No. of bitstreams: 2 arquivo8_1.pdf: 1293352 bytes, checksum: 746673d69958e017a467483837256871 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco / A caça predatória ilegal é o segundo maior fator de impacto em populações de animais silvestres no Brasil, ficando atrás apenas da perda de habitat por desmatamento. Apesar de ser proibida no Brasil (Leis n° 5.197/1967 e n° 9.605/1998), o poder público ainda não dispõe de recursos eficientes e cientificamente testados que possam ser utilizados em análises forenses visando comprovar o ato da caça, seja ela desportiva ou com finalidade comercial. A análise baseada no DNA tem sido utilizada em várias situações, com a finalidade de detectar fraudes comerciais e outras ilegalidades. Diante do exposto, o objetivo do presente trabalho foi à identificação e a utilização de perfis de PCR/RFLP espécieespecíficos para diagnóstico forense de 15 espécies da fauna brasileira e sua diferenciação de quatro espécies domésticas (bovino, suíno, caprino, ovino), totalizando 19 espécies. Para tanto foram realizadas análises de seqüências de nucleotídeos com os programas Sequencher 4.9, BioEdit 6.0.7, CLEAVER, pDRAW e Gene Runner 3.0.5, tendo sido identificados vários SNPs associados à criação de sítios de enzimas de restrição discriminantes. Com apenas 9 enzimas foram obtidos os perfis de PCR/RFLP discriminantes para as 19 espécies. A validação do protocolo in vitro foi realizada com amostras biológicas de 6 espécies silvestres (Agouti paca, Cebus apella, Dasyprocta leporina, Dasypus novemcinctus, Euphractus sexcinctus, Tayassu tajacu) juntamente com 4 espécies domésticas (Bos taurus, Capra hircus, Ovis aries and Sus scrofa), e os perfis detectados na analise in silico foram confirmados em gel de agarose 2%. O presente estudo reforçou o potencial de polimorfismos do gene Citocromo b como poderosos marcadores para identificação de espécies. Os dados produzidos aqui podem ser úteis como ferramentas em conservação no combate a caça predatória e monitoramento do comércio ilegal de carne de caça e de seus produtos
185

Análise transcriptômica nas coníferas brasileiras Araucaria angustifolia (Bert,) O. Kuntze (Araucariaceae) e Podocarpus lambertti Klotzsch ex Eichler (Podocarpaceae)

Klabunde, Gustavo Henrique Ferrero January 2016 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Ciências Agrárias, Programa de Pós-Graduação em Recursos Genéticos Vegetais, Florianópolis, 2016. / Made available in DSpace on 2016-09-20T04:22:18Z (GMT). No. of bitstreams: 1 340768.pdf: 4219482 bytes, checksum: d608a114a77752c0cc8ec9aac75e3836 (MD5) Previous issue date: 2016 / Araucaria angustifolia e Podocarpus lambertii são coníferas brasileiras criticamente ameaçadas de extinção. Várias lacunas em diversas áreas de pesquisa como a fisiologia do desenvolvimento e biologia reprodutiva são obstáculos para o conhecimento, uso sustentável e proposição de medidas de conservação destes recursos genéticos. Entretanto, poucos estudos genômicos e transcriptômicos foram realizados nestas espécies. Este trabalho teve como principal objetivo o sequenciamento e a caracterização de transcriptomas de amostras de A. angustifolia (folhas, pólen e hastes) e P. lambertii (folhas). Um total de 341.278.253 (45.6 Gb) de leituras brutas foram obtidas da plataforma de sequenciamento de segunda geração Ion Proton, sendo utilizadas para a montagem referenciada e de novo dos transcriptomas, gerando 60.043 sequências contíguas. Em A. angustifolia, foram anotados, via gene onthology (GO) 4.354 unigenes distintos a partir do transcriptoma de folhas, 3.643 unigenes do transcriptoma de hastes e 9.354 unigenes do transcriptoma de pólen. Em P. lambertii foram identificados 4.649 unigenes no transcriptoma de folhas. A identificação e caracterização in silico e desenho de iniciadores de 56 marcadores moleculares microssatélites (SSR) e 259 marcadores de polimorfismo de base única (SNP) para as duas espécies foi realizada a partir dos dados disponíveis. Os motivos SSRs mais abundantes foram mononucleotídeos (39,7 %), seguidos por tetranucleotídeos (22,22 %) e trinucleotídeos (20,63 %). A relação entre o número de transversões e transições (Ti/Tv) foi de 2,15 para A. angustifolia e de 1,05 para P. lambertii. Os resultados obtidos para os marcadores SNPs apontam diferentes padrões na substituição de nucleotídeos entre as espécies, no entanto, os padrões dos marcadores SSRs foram muito semelhates entre Araucaria e Podocarpus. Este trabalho descreve os primeiros transcriptomas gerados de amostras coletadas a campo para ambas espécies e os resultados gerados fornecem subsídios que auxiliarão no entendimento sobre funções específicas de estruturas, evolução e servirão de base para futuros estudos funcionais e populacionais.<br> / Abstract : Araucaria angustifolia and Podocarpus lambertii are critically endangered brazilian conifers. Several gaps in many research areas like developmental phisiology and reproductive biology are obstacles to its knowledge, breeding, sustainable use of these genetic resources and proposition of conservation measures. However, few genomic and transcriptomic studies have been contucted on these species. The main objective of this work was the sequencing and characterization of transcriptomes from A. angustifolia (leaf, pollen and stem) and P. lambertii (leaf). A total of 341.278.253 (45.6 Gb) of raw reads were obtained from the Ion Proton second generation DNA sequencing platform and being used for reference based and de novo transcriptome assembly, generating 60.043 contigs. In A. angustifolia were annotated with the use of gene onthology (GO) 4.354 distinct unigenes from leaves transcriptome, 3.643 unigenes from stem and 9.354 unigenes from the pollen transcriptome. In P. lambertii were identified 4.649 unigenes from leaves transcriptome. In addition, sequence data allowed the in silico identification, characterization and primer design of 56 simple sequence repeats (SSR) and 259 single nucleotide polymorphisms (SNP) molecular markers for both species were performed from the available data. The most abundant SSR repeat motif was mononucleotide (39,7 %), followed by tetranucleotide (22,22 %) and trinucleotide (20,63 %). The ratio between transitions and transversions was 2,15 for A. angustifolia and 1,05 for P. lambertii. SNP results show distinct patterns for nucleotide substitutions between species, however, SSRs patterns were very similar between Araucaria and Podocarpus. This work therefore describes the first transcriptomes from field samples for both species and the results provide valuable resources for plant breeding, will further contribute on the understanding about tissue specific functions, conifers evolution and will be the base for future functional and populational studies.
186

Isolamento e caracterização in silico de ciclotídeos em milho (Zea mays) e centeio (Secale cereale)

LIMA, Sheyla Carla Barbosa da Silva 24 February 2015 (has links)
Submitted by Haroudo Xavier Filho (haroudo.xavierfo@ufpe.br) on 2016-04-22T16:55:34Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertacao_SheylaSilvaLima_2015.pdf: 4958893 bytes, checksum: 21511e1c9e1a86ea210befeb33c91543 (MD5) / Made available in DSpace on 2016-04-22T16:55:34Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertacao_SheylaSilvaLima_2015.pdf: 4958893 bytes, checksum: 21511e1c9e1a86ea210befeb33c91543 (MD5) Previous issue date: 2015-02-24 / FACEPE / Ciclotídeos são uma classe de peptídeos antimicrobianos (AMPs - do inglês Antimicrobial peptide) cíclicos de plantas, compostos de, aproximadamente, 30 resíduos de aminoácidos, sendo seis cisteínas conservadas e conectadas por três pontes de dissulfeto. Sua expressão é constitutiva, tendo sua principal função na defesa vegetal contra patógenos, que podem causar perdas significativas em culturas importantes para a agricultura, como no caso da família Poaceae que apresenta destacada importância econômica no Brasil e no mundo. Nesse estudo foi conduzida uma busca por genes relacionados a ciclotídeos vegetais, disponíveis em bancos de dados de acesso restrito e público, com vistas ao isolamento e caracterização in silico desses peptídeos. Através da busca nos genomas de Hevea brasiliensis, Manihot esculenta, Ricinus communis, Sorghum bicolor e Zea mays; bem como no transcriptoma de Vigna unguiculata foi verificado que apenas o genoma de Zea mays apresentou dois possíveis genes codificadores de ciclotídeos. Assim, primers foram desenhados para o isolamento destes genes em milho. Além da espécie Z. mays, as espécies Triticum aestivum (trigo) e Secale cereale (centeio), foram utilizadas para a tentativa de isolamento a partir dos pares de primers desenhados. Foram obtidos 19 fragmentos (amplicons), sendo quatro deles (zm315, zm316, zm317, sc359) com o domínio ciclotídeo, os três primeiros de milho e o último de centeio. Essas quatro sequências foram, então, submetidas a uma caracterização in silico, para predição da estrutura secundaria, terciaria e função predita. Verificou-se que esses peptídeos apresentam as seis cisteínas conservadas, três pontes dissulfeto e o padrão de aminoácidos entre as cisteínas, similar aos encontrados em ciclotídeos. Ainda foi possível a predição de algumas propriedades físico-químicas e modelagem por homologia para as quatro proteínas, o que mostrou a qualidade e confiabilidade dos modelos. Sugere-se que dois dos ciclotídeos isolados (zm315, zm316) pertençam a uma nova classe de peptídeos lineares, mas com características de ciclotídeos. / Cyclotides are a class of cyclic antimicrobial peptides (AMPs) present on plants, composed by approximately 30 amino acid residues, including six conserved cysteines connected by three disulphide bridges. Its expression is constitutive, with main function on plant defense against pathogens, that may cause significant losses in important cultivars, as in the case of Poaceae, a family that presents economic importance for the agriculture in Brazil and worldwide. This study performed a search for genes related to plant cyclotides, available in restricted and public access databases, aimed at their in silico isolation and characterization. Searching for these peptides in Hevea brasiliensis, Manihot esculenta, Ricinus communis, Sorghum bicolor, Vigna unguiculata and Zea mays genomes, we obtained two possible genes encoding Cyclotides in Z. mays. Thus, primers were designed for the isolation of these genes in maize as well in wheat (Triticum aestivum) and rye (Secale cereale) species. We obtained 19 amplicons and four of them (zm315, zm316, zm317, sc359) presented cyclotide domain. These four sequences were then subjected to in silico characterization, for predicting their secondary and tertiary structures, as well their function. It was found that these peptides present six conserved cysteines, three disulphide bridges and the amino acid pattern between the cysteines similar to those found in cyclotides. It was also possible to predict some physical chemical properties and also building a 3D protein by homology modeling for the four peptides, presenting high quality and reliability. Our analysis indicates that two isolated cyclotides (zm315, zm316) appear to belong to a new class of linear peptides, but with cyclotide features.
187

Estudos funcionais e estruturais para a caracterização da via de captação e assimilação de sulfato em Xanthomonas axonopodis pv. citri. / Structural and functional studies for characterization of the sulfate uptake and assimilation pathway from Xanthomonas axonopodis pv. citri.

Cristiane Tambascia Pereira 03 July 2013 (has links)
Em Escherichia coli, a assimilação de sulfato e sua redução a sulfeto é mediada por um transportador do tipo ABC codificado pelos genes sbpcysWUA e várias enzimas codificadas por cysNCDGHIJ. Embora a importância deste sistema tenha sido largamente demonstrada em outros organismos, não existem relatos na literatura sobre a via na bactéria fitopatogênica Xanthomonas axonopodis pv. citri (X. citri). Neste trabalho, utilizando uma abordagem funcional baseada em análises de bioinformática, proteômica e gene repórter, mostramos que a via de sulfato está presente e ativa em X. citri. Ainda, a partir da expressão e produção em larga escala da proteína ligadora de sulfato Sbp, realizamos ensaios de biofísica que evidenciaram a interação da proteína com sulfato e o aumento da estabilidade térmica e estrutural, obtendo-se cristais. O trabalho apresenta as primeiras evidências da funcionalidade desta via em X. citri durante o crescimento in vitro e infecção in vivo e abre pespectivas de estudos para compreensão do papel deste íon na fisiologia do microrganismo. / In Escherichia coli, the capture and reduction of sulfate to sulfide is mediated by an ABC-type transporter encoded by genes sbpcysWUA and several enzymes encoded by cysNCDGHIJ. Although the importance of this system has been widely demonstrated in other organisms, there are no reports in the literature related to the way that sulfate is assimilated and reduced in plant pathogen Xanthomonas axonopodis pv. citri (X. citri). In this work, using a functional approach based on bioinformatics analysis, proteomics and gene reporter, we show that the way is present and active in X. citri. Indeed, the sulfate binding protein was expressed and produced in large scale for biophysical assays demonstrating the interaction of the protein with sulfate and increased thermal stability and crystals was produced. The study presents the first evidence of the functionality of this pathway in X. citri during growth in vitro and in vivo infection and opens perspectives studies to understand the role of this ion in the physiology of the microorganism.
188

Ferramenta computacional para análise integrada de dados clínicos e biomoleculares / Computational framework for integrated analysis of biomolecular and clinical data

Yuri Ferretti 11 December 2015 (has links)
A massificação dos estudos da medicina translacional permite aos pesquisadores que usufruam de fontes de dados das mais diversas áreas. Uma área de suma importância e a bioinformatica, que agrega o alta capacidade de processamento computacional disponível atualmente, com a infindável quantidade de dados gerada por métodos de sequenciamento de ultima geração, para entregar aos pesquisadores uma quantidade rica de dados para serem analisados. Apesar da disponibilidade desses dados, a expertise necessária para analisa-los dificulta que profissionais com pouco conhecimento em bioinformatica, estatística e ciência da computação possam realizar pesquisas e analises com estes dados. Dada esta situação, este trabalho consistiu em criar uma ferramenta que tira proveito da integração de múltiplas bases de dados proporcionada pelo framework IPTrans, permitindo que usuários da área biomédica realizem analises com os dados contidos nessas bases. Com base em outras ferramentas existentes e em um levantamento de requisitos junto a potenciais usuários, foram identificadas as funcionalidades mais importantes e assim foi projetada e implementada a IPTrans Advanced Analysis Tool (IPTrans A2Tool). Esta ferramenta permite que usuários façam analises de expressão diferencial mais comuns como heatmaps, volcano plots, consenso de agrupamentos e blox-plot. Além disso, a ferramenta proporciona um algoritmo de mineração de dados baseado na extração de regras de associação entre dados clínicos e biomoleculares, que permite ao usuário descobrir novas associações entre a expressão dos genes dados clínicos e fenotípicos. Adicionalmente a este trabalho, foi criado também o BioBank Warden, um sistema de controle de dados clínicos e amostras biomoleculares, que foi utilizado como uma das fontes de dados para o IPTrans A2Tool. Este sistema permite que usuários adicionem informações clinicas de pacientes e também das amostras extraídas para a realização de estudos. Uma avaliação preliminar de usabilidade, realizada junto a profissionais da área biomédica, mostrou que as ferramentas possuem potencial para serem utilizadas no contexto da medicina translacional. / The great number of translational medicine studies allows researchers to make benefit of data sources from various fields. An area of great importance is bioinformatics, which combines the high computational processing capabilities found nowadays with the endless amount of data generated by next-generation sequencing methods, to give researchers a rich amount of data to be analyzed. Despite the availability of such data, the expertise required to analyze it makes difficult for professionals with little knowledge in bioinformatics, statistics or computer science, to conduct research and analysis on this data. Given this situation, this work was intended to create a tool that takes advantage of multiple databases integration capabilities provided by IPTrans and that allows users to perform analysis on the data contained in these databases. To accomplish that other tools were studied in order to observe which features our framework should aggregate and thus was created the IPTrans A2Tool (IPTrans Advanced Analysis Tool). This tool allows users to perform differential expression analysis and generate output as heatmaps, volcano plots, consensus clustering and blox-plots. In addition, the tool provides an association rule extraction algorithm between clinical and biomolecular data, allowing the user to discover hidden associations between the expression of analyzed genes and clinical data. As a by-product of this work was also created the BioBank Warden a clinical data and biomolecular samples management system that was used as one of the data sources for IPTrans A2Tool. This system allows users to add patients clinical information and also of samples taken for carrying out studies. In addition, the system provides a strong research group and project permission management that ensures only authorized people to have access to patients data.
189

Bioinformática estrutural de proteínas modificadas por eventos de splicing alternativo / Structural Bioinformatics of Proteins modified by Alternative Splicing

Elza Helena Andrade Barbosa Durham 10 December 2007 (has links)
Bioinformática estrutural de proteínas modificadas por eventos de splicing alternativo / Structural Bioinformatics of Proteins modified by Alternative Splicing
190

Algoritmos eficientes para análise de campos aleatórios condicionais semi-markovianos e sua aplicação em sequências genômicas / Efficient algorithms for semi-markov conditional random fields and their application for the analysis of genomic sequences

Ígor Bonadio 06 August 2018 (has links)
Campos Aleatórios Condicionais são modelos probabilísticos discriminativos que tem sido utilizados com sucesso em diversas áreas como processamento de linguagem natural, reconhecimento de fala e bioinformática. Entretanto, implementar algoritmos eficientes para esse tipo de modelo não é uma tarefa fácil. Nesse trabalho apresentamos um arcabouço que ajuda no desenvolvimento e experimentação de Campos Aleatórios Condicionais Semi Markovianos (semi-CRFs). Desenvolvemos algoritmos eficientes que foram implementados em C++ propondo uma interface de programação flexível e intuitiva que habilita o usuário a definir, treinar e avaliar modelos. Nossa implementação foi construída como uma extensão do arcabouço ToPS que, inclusive, pode utilizar qualquer modelo já definido no ToPS como uma função de característica especializada. Por fim utilizamos nossa implementação de semi-CRF para construir um preditor de promotores que apresentou performance superior aos preditores existentes. / Conditional Random Fields are discriminative probabilistic models that have been successfully used in several areas like natural language processing, speech recognition and bioinformatics. However, implementing efficient algorithms for this kind of model is not an easy task. In this thesis we show a framework that helps the development and experimentation of Semi-Markov Conditional Random Fields (semi-CRFs). It has an efficient implementation in C++ and an intuitive API that allow users to define, train and evaluate models. It was built as an extension of ToPS framework and can use ToPS probabilistic models as specialized feature functions. We also use our implementation of semi-CRFs to build a high performance promoter predictor.

Page generated in 0.0387 seconds