• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 143
  • 8
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 3
  • 1
  • Tagged with
  • 150
  • 150
  • 54
  • 52
  • 34
  • 31
  • 31
  • 24
  • 22
  • 21
  • 20
  • 20
  • 19
  • 19
  • 19
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
111

LASZLO @ GALAXY - Um protótipo de serviço de montagem de genomas a partir de dados de sequenciamento de próxima geração (NGS) / LASZLO @ GALAXY - A genome assembly service prototype using Next-Generation Sequencing (NGS) data

Ribeiro, Antonio Cláudio Bello January 2012 (has links)
Submitted by Alessandra Portugal (alessandradf@ioc.fiocruz.br) on 2013-09-20T18:32:48Z No. of bitstreams: 1 Antonio Claudio Bello Ribeiro_Dissertação.pdf: 10104776 bytes, checksum: 898762236c2195576efe34934817220b (MD5) / Made available in DSpace on 2013-09-20T18:32:48Z (GMT). No. of bitstreams: 1 Antonio Claudio Bello Ribeiro_Dissertação.pdf: 10104776 bytes, checksum: 898762236c2195576efe34934817220b (MD5) Previous issue date: 2012 / Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Vice Direção de Ensino, Informação e Comunicação. Rio de Janeiro, RJ, Brasil. / As tecnologias NGS (Next-Generation Sequencing), desenvolvidas para reduzir o custo e o tempo do processo de sequenciamento, geram uma grande massa de dados, a um custo relativamente baixo e com grande acurácia. No entanto, as leituras curtas, por elas produzidas, dificultam sobremaneira o processo de montagem de genomas, originando novos problemas computacionais. Para tentar suplantar esses desafios, várias ferramentas de software estão disponíveis e continuam a ser desenvolvidas. Cada um desses pacotes possui vantagens e desvantagens e, na maioria das vezes, se apresenta como uma solução individual, não estando integrado a outros. Além disso, tipicamente é exigido um conhecimento mais avançado de informática para a sua correta instalação, configuração e operação; o que, nem sempre, é a realidade do usuário final. Neste contexto, o projeto nomeado LASZLO (Linkage of Assembly Scripts Zero-costed and with License Opened) @ GALAXY propõe combinar diferentes ferramentas de tratamento de dados de NGS de uso livre, na forma de um protótipo básico de serviço de montagem de genomas, buscando facilitar o trabalho do usuário através da disponibilização de uma interface Web, sugestões de parametrização e de fluxos de trabalho para esse tipo de análise. Tomando por base o framework Galaxy, foram agregados fluxos de trabalho para montagens de dados de sequenciamento reais de diferentes organismos e provenientes das tecnologias Illumina, SOLiD™ e 454. O caráter aplicado do projeto originou soluções pontuais para atender a necessidades específicas, as quais foram reunidas sob o módulo NGS: LASZLO's Sandbox, uma "caixa de ferramentas" especialmente designada às abordagens de montagem do tipo de novo e com auxílio de genoma de referência. Durante a pesquisa, o protótipo LASZLO @ GALAXY processou, por exemplo, dados de sequenciamento de Leishmania amazonensis, contribuindo para um primeiro processo de avaliação do genoma do referido organismo. Atualmente, observa-se que a produção de dados não é o mais o "gargalo" em projetos de sequenciamento, mas sim o fluxo de análise subsequente sobre o material obtido. Muitas vezes, tais dados não se traduzem imediatamente em expansão do conhecimento biológico, devido às dificuldades encontradas pelo biólogo experimental em lidar, não somente com a miríade de ferramentas disponíveis, mas também com fatores como a inerente necessidade de integração entre elas e a implementação de infra-estrutura adequada para a sua operação. Os resultados obtidos no projeto indicam que o sistema proposto, vislumbrado como um eventual serviço institucional ou mesmo de menor âmbito, pode se tornar um aliado do usuário final quanto à manipulação dos dados de NGS. / The NGS (Next-Generation Sequencing) technologies, designed to reduce sequencing process costs and time, generate a huge amount of data, at a relatively low cost and with great accuracy. However, the produced short reads strongly difficult the genome assembly process, originating new computational issues. To overcome those challenges, there are several software tools available and continuously being developed. Each of these tools presents advantages and disadvantages and most of them are isolated, not integrated solutions. Moreover, typically it is required a higher level of computer-literacy for their proper installation, configuration and usage, which, not always, is the end-user reality. In this context, the project named LASZLO (Linkage of Assembly Scripts Zero-costed and with License Opened) @ GALAXY suggests to combine different open source tools for NGS data handling, as a basic prototype service for genome assembly, aiming at simplifying the end-user task by providing a Web interface, suggestions of parametrization and workflows for this kind of analysis. Based on the Galaxy framework, some workflows for the assembly of real sequencing data from different organisms and produced by the Illumina, SOLiD™ and 454 technologies were aggregated. Also, due to the applied characteristic of the project, a few punctual solutions were generated to address specific needs. Those solutions were encapsulated in the NGS: LASZLO's Sandbox module, a "toolbox" especially tailored for the de novo and reference-guided assembly approaches. During the research, the LASZLO @ GALAXY prototype processed, for instance, sequencing data of the Leishmania amazonensis organism, contributing for a first evaluating process of its genome. Presently, it's noticed that the data generation is no longer the "bottleneck" of the sequencing projects, but the downstream data analysis. Frequently, the acquired data is not immediately translated into biological knowledge expansion, due to the obstacles met by the experimental biologist when dealing, not only with the myriad of available tools, but also with factors like the inherent need of their integration and the deployment of the adequate infrastructure for their operation. The results achieved during project execution indicate that the proposed system, glimpsed as an eventual institutional service or even as one of smaller scope, might become an end-user's ally in the NGS data manipulation.
112

Técnicas para construção de árvores filogenéticas / Techniques for construction of phylogenetic trees

Viana, Gerardo Valdíso Rodrigues January 2007 (has links)
VIANA, Gerardo Valdíso Rodrigues. Técnicas para construção de árvores filogenéticas. 2007. 203 f. Tese (Doutorado em ciência da computação)- Universidade Federal do Ceará, Fortaleza-CE, 2007. / Submitted by Elineudson Ribeiro (elineudsonr@gmail.com) on 2016-07-20T12:05:20Z No. of bitstreams: 1 2007_tese_gvrviana.pdf: 3571043 bytes, checksum: 34853f08d8a8ac37e7c9e07dcf25de25 (MD5) / Approved for entry into archive by Rocilda Sales (rocilda@ufc.br) on 2016-07-25T11:50:34Z (GMT) No. of bitstreams: 1 2007_tese_gvrviana.pdf: 3571043 bytes, checksum: 34853f08d8a8ac37e7c9e07dcf25de25 (MD5) / Made available in DSpace on 2016-07-25T11:50:34Z (GMT). No. of bitstreams: 1 2007_tese_gvrviana.pdf: 3571043 bytes, checksum: 34853f08d8a8ac37e7c9e07dcf25de25 (MD5) Previous issue date: 2007 / Phylogenetic tree structures express similarities, ancestrality, and relationships between species or group of species, and are also known as evolutionary trees or phylogenies. Phylogenetic trees have leaves that represent species (taxons), and internal nodes that correspond to hypothetical ancestors of the species. In this thesis we rst present elements necessary to the comprehension of phylogenetic trees systematics, then ef cient algorithms to build them will be described. Molecular biology concepts, life evolution, and biological classi cation are important to the understanding of phylogenies. Phylogenetic information may provide important knowledge to biological research work, such as, organ transplantation from animals, and drug toxicologic tests performed in other species as a precise prediction to its application in human beings. To solve a phylogeny problem implies that a phylogenetic tree must be built from known data about a group of species, according to an optimization criterion. The approach to this problem involves two main steps: the rst refers to the discovery of perfect phylogenies, in the second step, information extracted from perfect phylogenies are used to infer more general ones. The techniques that are used in the second step take advantage of evolutionary hypothesis. The problem becomes NP-hard for a number of interesting hypothesis, what justify the use of inference methods based on heuristics, metaheuristics, and approximative algorithms. The description of an innovative technique based on local search with multiple start over a diversi ed neighborhood summarizes our contribution to solve the problem. Moreover, we used parallel programming in order to speed up the intensi cation stage of the search for the optimal solution. More precisely, we developed an ef cient algorithm to obtain approximate solutions for a phylogeny problem which infers an optimal phylogenetic tree from characteristics matrices of various species. The designed data structures and the binary data manipulation in some routines accelerate simulation and illustration of the experimentation tests. Well known instances have been used to compare the proposed algorithm results with those previously published. We hope that this work may arise researchers' interest to the topic and contribute to the Bioinformatics area. / Árvores filogenéticas são estruturas que expressam a similaridade, ancestralidade e relacionamentos entre as espécies ou grupo de espécies. Conhecidas como árvores evolucionárias ou simplesmente filogenias, as árvores filogenéticas possuem folhas que representam as espécies (táxons) e nós internos que correspondem aos seus ancestrais hipotéticos. Neste trabalho, além das informações necessárias para o entendimento de toda a sistemática filogenética, são apresentadas técnicas algorítmicas para construção destas árvores. Os conceitos básicos de biologia molecular, evolução da vida e classificação biológica, aqui descritos, permitem compreender o que é uma Filogenia e qual sua importância para a Biologia. As informações filogenéticas fornecem,por exemplo, subsídios importantes para decisões relativas aos transplantes de órgãos ou tecidos de outras espécies para o homem e para que testes de reação imunológica ou de toxicidade sejam feitos antes em outros sistemas biológicos similares ao ser humano. Resolver um Problema de Filogenia corresponde à construção de uma árvore filogenética a partir de dados conhecidos sobre as espécies em estudo, obedecendo a algum critério de otimização. A abordagem dada a esse problema envolve duas etapas, a primeira, referente aos casos em que as filogenias são perfeitas cujos procedimentos desenvolvidos serão utilizados na segunda etapa, quando deve ser criada uma técnica de inferência para a filogenia num caso geral. Essas técnicas consideram de forma peculiar as hipóteses sobre o processo de evolução. Para muitas hipóteses de interesse o problema se torna NP-Difícil, justificando-se o uso de métodos de inferência através de heurísticas, meta-heurísticas e algoritmos aproximativos. Nossa contribuição neste trabalho consiste em apresentar uma técnica de resolução desse problema baseada em buscas locais com partidas múltiplas em vizinhanças diversificadas. Foi utilizada a programação paralela para minimizar o tempo de execução no processo de intensificação da busca pela solução ótima do problema. Desta forma, desenvolvemos um algoritmo para obter soluções aproximadas para um Problema da Filogenia, no caso, para inferir, a partir de matrizes de características de várias espécies, uma árvore filogenética que mais se aproxima da história de sua evolução. Uma estrutura de dados escolhida adequadamente aliada à manipulação de dados em binário em algumas rotinas facilitaram a simulação e ilustração dos testes realizados. Instâncias com resultados conhecidos na literatura foram utilizadas para comprovar a performance do algoritmo. Esperamos com este trabalho despertar o interesse dos pesquisadores da área de Computação, consolidando, assim, o crescimento da Bioinformática.
113

Desenvolvimento de um sistema integrado para genotipagem de protozoários patogênicos utilizando-se genes ortólogos universais

Tschoeke, Diogo Antônio January 2010 (has links)
Submitted by Anderson Silva (avargas@icict.fiocruz.br) on 2012-05-14T13:46:13Z No. of bitstreams: 1 diogo_a_tschoeke_ioc_bcs_0001_2010.pdf: 39185036 bytes, checksum: e20b3df10a81fb78c2e226162dfdd94c (MD5) / Made available in DSpace on 2012-05-14T13:46:13Z (GMT). No. of bitstreams: 1 diogo_a_tschoeke_ioc_bcs_0001_2010.pdf: 39185036 bytes, checksum: e20b3df10a81fb78c2e226162dfdd94c (MD5) Previous issue date: 2010 / Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil. / Este trabalho teve com objetivo o desenvolvimento e a validação/aplicação de um sistema integrado de genotipagem de protozoários, utilizando uma abordagem multidisciplinar envolvendo, PCR multiplex e análise bioinformática envolvendo evolução e filogenia molecular. Para isso, trinta e seis genes ortólogos universal (UOG) foram identificados e usados como marcadores para genotipagem de protozoários parasitas, a nível inter-específico. Temos extraído os dados genéticos de genes ortólogos universal selecionado. Para isso, estamos utilizando sequências de grupos ortólogos (COG e KOG). O COG é composto de genes ortólogos individuais ou grupos de ortólogos de parálogos de 3 ou mais linhagens filogenéticas. Os COG de interesse selecionados estão envolvidos processo de tradução protéica, categoria J do COG, e estes genes foram selecionados porque eles estão presentes em todos os organismos estudados até agora, o que facilita a montagem de um sistema integrado de protozoários patogênicos. As sequências desses genes foram obtidos a partir do banco de dados GenBank. Seqüências de espécies de Eimeria tenella, Leishmania major, L. braziliensis, L. infantum, Trypanosoma brucei, T. cruzi, T. vivax, Plasmodium falciparum e P. vivax foram obtidas e armazenadas localmente. Estas sequências nucleotídicas foram traduzidas em proteínas, e então validadas usando a ferramenta COGnitor/KOGnitor, que mostra a sequência selecionada pertence ao respectivo COG de interesse. Após essa validação, as sequências foram utilizadas nos alinhamentos e construção de iniciadores que foram usados para gerar fragmentos gênicos amplificados por PCR. Os programas para a construção dos iniciadores foram: Mafft para a construção de alinhamentos múltiplos de cada COG, JalView para visualizá-los e o programa Primer3 para o desenho dos iniciadores. Todo o processo foi realizado por um pipeline de integração destes programas escritos em linguagem de programação Perl. Após o processo automatizado de validação, alinhamento e construção dos iniciadores, realizamos uma análise final dos iniciadores, considerando suas características e da região de pareamento. Quando necessário, definiu-se manualmente a degeneração da posição dos nucleotídeos que contem a variação. Criamos 33 pares de iniciadores, que foram utilizados para a amplificação destes genes via PCR. As reações de amplificação da PCR fora bem-sucedida em 19 UOG nas espécies Leishmania major, L. braziliensis, L. infantum, L. mexicana, T. cruzi, T. vivax e Plasmodium vivax, utilizando-se iniciadores com posições degeneradas. Para genotipagem das seqüências geradas pela PCR, foi utilizado o programa Phred que realizou a leitura dos cromatogramas com qualidade por base, Phred ≥ 15, e o programa Blast foi utilizado para a caracterização das sequências geradas, estas duas etapas foram realizadas em pipeline de anotação que está disponível através de um website. As árvores filogenéticas foram geradas com o método de máxima verossimilhança utilizando o pipeline ARPA, e revelou que a metodologia apresenta potencial para ser utilizado na genotipagem destes organismos e os genes da metionil-tRNA sintetase e Seril-tRNA sintetase mostraram boa resolução para a genotipagem inter-específicas de tripanosomatídeos. / The aim of this work is to develop and validate an integrated genotyping system for protozoan parasites, using a multidisciplinary approach involving, multiplex PCR, and bioinformatics analysis involving molecular evolution and phylogeny. For this, thirty three universal orthologous genes (UOG) has been identified [1] and used as markers for genotyping parasitic protozoan at the intraspecific level. We have mined genomic data of universal orthologous genes selected. For this, we are using sequences of orthologous groups (COGs and KOGs). The COG's consists of individual orthologous genes or orthologous groups of paralogous of 3 or more phylogenetic lineages. The selected COGs of interest are involved protein translation process, category J of the COG and these genes are selected because they are present in all organisms studied so far, facilitating the assembly of an integrated system for the pathogenic protozoa. Note that all these genes are part of the process of protein translation. The sequences of these genes were obtained from GenBank database. Sequences of species, Eimeria tenella, Leishmania major, L. braziliensis, L. infantum, Trypanosoma brucei, T. cruzi, T. vivax, Plasmodium falciparum and P. vivax were obtained and locally stored. Nucleotide sequences were translated into proteins. So, they are validated using the Blast similarity tool and the database as the COG itself, which shows the sequence selected belongs to the respective COG. After this validation, the sequences were used in alignments and construction of primers that are used to generate amplicons by PCR. The programs for the primer construction were: Mafft for construction of multiple alignments of each COG, JalView to view them and the program Primer3Plus [6] for the design of primers. The whole process was performed by a pipeline integrating these programs written in Perl [7] programming language. After the automated process of validation, alignment and construction of the primers, we perform a final analysis of the primers manually, which gives its characteristics and the annealing region. When necessary, we manually define the degeneration of nucleotide position containing variations. We have designed 33 primer pairs, and these primers were designed and used for PCR amplification. The reactions of PCR amplification was successful for 19 UOG in species: Leishmania major, L. braziliensis, L. infantum, L. mexicana, T. cruzi, T. vivax and Plasmodium vivax, using primers with degenerate positions. For genotyping the sequences generates by PCR amplification was used the program Phred for reading chromatograms file with quality ≥ 15, and Blast to the characterization of sequences generated, this two steps was make with a pipeline and is available through a website. The phylogenetic trees was generated with methods of maximum likelihood using the pipeline ARPA, and revealed that the methodology has potential to be used in genotyping of these organisms, and genes of methionyl-tRNA synthetase, seryl- tRNA synthetase showed good resolution for the inter-specific genotyping of trypanosomatids.
114

Biologia computacional na identificação dos reguladores mestres da transcrição em câncer pancreático

Sartor, Ivaine Tais Sauthier January 2014 (has links)
O adenocarcinoma de ducto pancreático é reconhecido mundialmente como uma doença extremamente agressiva a qual apresenta um prognóstico desfavorável para pacientes sem cirurgia de ressecção. Portanto, é fundamental ampliar o conhecimento sobre os mecanismos biológicos envolvidos no câncer pancreático a fim de permitir a identificação de marcadores moleculares e alvos terapêuticos com o intuito de melhorar o diagnóstico precoce e tratamento. Os fatores de transcrição, reconhecidos por serem os efetores finais de vias de sinalização, regulam diversas funções celulares e, alterações na expressão transcricional destes podem contribuir para a transformação celular bem como para a progressão tumoral. Assim, o objetivo do presente estudo foi identificar os reguladores mestres da transcrição, possivelmente envolvidos no câncer pancreático. Para tanto, utilizamos dados de microarranjos para associar os reguladores mestres com o fenótipo tumoral. As análises foram realizadas no ambiente estatístico R utilizando os pacotes RTN, Limma e Survival. O gene TULP3 foi identificado como um regulador mestre da transcrição em amostras de câncer pancreático. O valor prognóstico de TULP3 foi verificado através de análises de sobrevivência em três coortes independentes. Estas análises revelaram que pacientes com adenocarcinoma pancreático, exibindo altos níveis de expressão do gene TULP3, apresentam uma sobrevida global desfavorável. Os altos níveis transcricionais de TULP3 podem desempenhar um papel fundamental na progressão do adenocarcinoma pancreático e conduzir a um resultado clínico desfavorável. Contudo, este estudo destaca a potencial aplicação de TULP3 como um biomarcador de prognóstico clínico para pacientes com adenocarcinoma pancreático. / Pancreatic ductal adenocarcinoma is world-wide recognized as an aggressive disease with poor prognosis in patients who did not undergo resection. Efforts to better comprehend the biological mechanisms of pancreatic cancer are needed to enable the identification of novel molecular markers and therapeutic targets for improving early diagnosis and treatment. Transcription factors are the final effectors of signaling pathways and regulate a number of cellular functions. Changes in expression of transcription factors may contribute to cellular transformation and tumor progression. Thus, the aim of the present study was to identify transcriptional master regulators potentially involved in pancreatic cancer disease. To achieve this goal, we utilized microarray data to associate master regulators with tumor phenotype. Analyses were performed with RTN, Limma, and Survival packages at R environment. We identified TULP3 as a master regulator of transcription in pancreatic cancer samples. TULP3 prognostic value was accessed in three independent cohort analyses. Our data demonstrate that patients with pancreatic cancer, exhibiting high TULP3 transcriptional levels, show a poor overall survival. High levels of TULP3 expression may play an essential role in pancreatic cancer progression and lead to poor clinical outcome. Our results highlight the potential use of TULP3 as a clinical prognostic biomarker for pancreatic adenocarcinoma.
115

Techniques for construction of phylogenetic trees / TÃcnicas para construÃÃo de Ãrvores filogenÃticas

Gerardo ValdÃso Rodrigues Viana 27 April 2007 (has links)
FundaÃÃo Cearense de Apoio ao Desenvolvimento Cientifico e TecnolÃgico / Phylogenetic tree structures express similarities, ancestrality, and relationships between species or group of species, and are also known as evolutionary trees or phylogenies. Phylogenetic trees have leaves that represent species (taxons), and internal nodes that correspond to hypothetical ancestors of the species. In this thesis we rst present elements necessary to the comprehension of phylogenetic trees systematics, then efcient algorithms to build them will be described. Molecular biology concepts, life evolution, and biological classication are important to the understanding of phylogenies. Phylogenetic information may provide important knowledge to biological research work, such as, organ transplantation from animals, and drug toxicologic tests performed in other species as a precise prediction to its application in human beings. To solve a phylogeny problem implies that a phylogenetic tree must be built from known data about a group of species, according to an optimization criterion. The approach to this problem involves two main steps: the rst refers to the discovery of perfect phylogenies, in the second step, information extracted from perfect phylogenies are used to infer more general ones. The techniques that are used in the second step take advantage of evolutionary hypothesis. The problem becomes NP-hard for a number of interesting hypothesis, what justify the use of inference methods based on heuristics, metaheuristics, and approximative algorithms. The description of an innovative technique based on local search with multiple start over a diversied neighborhood summarizes our contribution to solve the problem. Moreover, we used parallel programming in order to speed up the intensication stage of the search for the optimal solution. More precisely, we developed an efcient algorithm to obtain approximate solutions for a phylogeny problem which infers an optimal phylogenetic tree from characteristics matrices of various species. The designed data structures and the binary data manipulation in some routines accelerate simulation and illustration of the experimentation tests. Well known instances have been used to compare the proposed algorithm results with those previously published. We hope that this work may arise researchers' interest to the topic and contribute to the Bioinformatics area. / Ãrvores filogenÃticas sÃo estruturas que expressam a similaridade, ancestralidade e relacionamentos entre as espÃcies ou grupo de espÃcies. Conhecidas como Ãrvores evolucionÃrias ou simplesmente filogenias, as Ãrvores filogenÃticas possuem folhas que representam as espÃcies (tÃxons) e nÃs internos que correspondem aos seus ancestrais hipotÃticos. Neste trabalho, alÃm das informaÃÃes necessÃrias para o entendimento de toda a sistemÃtica filogenÃtica, sÃo apresentadas tÃcnicas algorÃtmicas para construÃÃo destas Ãrvores. Os conceitos bÃsicos de biologia molecular, evoluÃÃo da vida e classificaÃÃo biolÃgica, aqui descritos, permitem compreender o que à uma Filogenia e qual sua importÃncia para a Biologia. As informaÃÃes filogenÃticas fornecem,por exemplo, subsÃdios importantes para decisÃes relativas aos transplantes de ÃrgÃos ou tecidos de outras espÃcies para o homem e para que testes de reaÃÃo imunolÃgica ou de toxicidade sejam feitos antes em outros sistemas biolÃgicos similares ao ser humano. Resolver um Problema de Filogenia corresponde à construÃÃo de uma Ãrvore filogenÃtica a partir de dados conhecidos sobre as espÃcies em estudo, obedecendo a algum critÃrio de otimizaÃÃo. A abordagem dada a esse problema envolve duas etapas, a primeira, referente aos casos em que as filogenias sÃo perfeitas cujos procedimentos desenvolvidos serÃo utilizados na segunda etapa, quando deve ser criada uma tÃcnica de inferÃncia para a filogenia num caso geral. Essas tÃcnicas consideram de forma peculiar as hipÃteses sobre o processo de evoluÃÃo. Para muitas hipÃteses de interesse o problema se torna NP-DifÃcil, justificando-se o uso de mÃtodos de inferÃncia atravÃs de heurÃsticas, meta-heurÃsticas e algoritmos aproximativos. Nossa contribuiÃÃo neste trabalho consiste em apresentar uma tÃcnica de resoluÃÃo desse problema baseada em buscas locais com partidas mÃltiplas em vizinhanÃas diversificadas. Foi utilizada a programaÃÃo paralela para minimizar o tempo de execuÃÃo no processo de intensificaÃÃo da busca pela soluÃÃo Ãtima do problema. Desta forma, desenvolvemos um algoritmo para obter soluÃÃes aproximadas para um Problema da Filogenia, no caso, para inferir, a partir de matrizes de caracterÃsticas de vÃrias espÃcies, uma Ãrvore filogenÃtica que mais se aproxima da histÃria de sua evoluÃÃo. Uma estrutura de dados escolhida adequadamente aliada à manipulaÃÃo de dados em binÃrio em algumas rotinas facilitaram a simulaÃÃo e ilustraÃÃo dos testes realizados. InstÃncias com resultados conhecidos na literatura foram utilizadas para comprovar a performance do algoritmo. Esperamos com este trabalho despertar o interesse dos pesquisadores da Ãrea de ComputaÃÃo, consolidando, assim, o crescimento da BioinformÃtica.
116

Acoplamento de modelos computacionais de doenças infecciosas

Quintela, Bárbara de Melo 20 March 2015 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-06T12:18:04Z No. of bitstreams: 1 barbarademeloquintela.pdf: 10528211 bytes, checksum: 7f9e15f4d69049b28b676fffca2ef945 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-06T20:20:45Z (GMT) No. of bitstreams: 1 barbarademeloquintela.pdf: 10528211 bytes, checksum: 7f9e15f4d69049b28b676fffca2ef945 (MD5) / Made available in DSpace on 2017-03-06T20:20:45Z (GMT). No. of bitstreams: 1 barbarademeloquintela.pdf: 10528211 bytes, checksum: 7f9e15f4d69049b28b676fffca2ef945 (MD5) Previous issue date: 2015-03-20 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O desenvolvimento de modelos matemáticos da resposta imunológica permite que os mecanismos desse sistema de defesa possam ser melhor compreendidos. O objetivo principal deste trabalho é a representação de diferentes escalas da interação entre patógeno e hospedeiro durante infecção e tratamento para auxiliar o estudo desses elementos através do estabelecimento do acoplamento de modelos matemáticos distintos. São apresentados dois exemplos de acoplamento. No primeiro um modelo em que o processo de inflamação local no pulmão é descrito por Equações Diferenciais Parciais (EDP) enquanto um sistema de Equações Diferenciais Ordinárias (EDO) é utilizado para representar a resposta sistêmica. A simulação de diferentes cenários permite a análise da dinâmica de diversas células do sistema imune na presença de um patógeno (bactéria). Foi mostrado através da análise de resultados qualitativos do acoplamento de modelos que a ação da resposta sistêmica é essencial para eliminação das bactérias. No segundo exemplo, um conjunto de equações diferenciais ordinárias representando uma infecção pelo vírus da hepatite C (HCV) é acoplado a um sistema de equações diferenciais parciais que foi desenvolvido para representar a dinâmica intracelular. Esse exemplo permitiu o estudo da replicação do HCV sob efeito de terapia com uso de drogas do tipo DAAs (Direct Acting Anti-virus) e foi validado comparando-se a dados experimentais. Os resultados reforçam que a partir dessas representações utilizando acoplamentos de modelos computacionais novas análises matemáticas e simulações de outros cenários podem ser realizadas em um espaço de tempo razoável, auxiliando o estudo do complexo sistema imune e o desenvolvimento de tratamento de infecções. / The development of mathematical models of the immune response allows a better understanding of the multifaceted mechanisms of this defense system. The main purpose of this work is to represent different scales and aspects of the host-pathogen interaction during infection and treatment by the coupling of distinct mathematical models. Two examples are defined. On the first example the local tissue inflammation processes are described by Partial Differential Equations (PDEs) whereas a system of Ordinary Differential Equations (ODEs) is used as a model for the systemic response. The simulation of distinct scenarios allows the analysis of the dynamics of different immune cells in the presence of a bacteria. It was shown with the qualitative analysis of the results of the coupled model that the systemic response is essential to eliminate the bacteria. In the second example a set of ordinary differential equations representing infection of the hepatitis C virus (HCV) is coupled to a set of partial differential equations that was developed to represent intracellular dynamics. That example allowed the study of HCV replication under therapy using direct acting antiviral drugs (DAAs) and was validated comparing to experimental data. The results support that with the coupling of computational models, other mathematical analysis and simulations could be performed, in a reasonable time frame, aiding to the study of the complex immune system and the development of treatment to infections.
117

Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos / Bioinformatic parameters of genomic context as predictors of functional impact in point substitutions of human gene 5' UTR

Urioste, Eduardo Arcanjo, 1989- 22 August 2018 (has links)
Orientador: Sérgio Roberto Peres Line / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba / Made available in DSpace on 2018-08-22T18:59:49Z (GMT). No. of bitstreams: 1 Urioste_EduardoArcanjo_M.pdf: 1274507 bytes, checksum: 0f7136d4dabaf0e810ad2bdf1b2ee815 (MD5) Previous issue date: 2013 / Resumo: Estima-se que cada indivíduo carregue cerca de 120 a 430 variantes raras em regiões UTRs (Abecasis et al, 2012). Apesar da tolerância a variação na região 5' UTR, a patofisiologia de várias doenças está ligada a mutações na mesma (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010), sendo necessário o entendimento a determinação dos mecanismos regulatórios. O objetivo deste trabalho é descobrir assinaturas genéticas encontradas no contexto genômico de mutações pontuais de região 5' UTR que permitam prever o impacto funcional de outras variações pontuais na mesma região. As mutações, causadora de doença, foram selecionadas do banco de dados do Human Gene Mutation Database (HGMD) (Stenson et al, 2008); e os polimorfismos, de impacto funcional desconhecido, foram obtidos no banco de dados NHLBI Grand Opportunity Exome Sequencing Project (ESP), sendo originados do trabalho de Tenessen et al (2012). No total foram utilizadas 235 mutações e 21.542 polimorfismos. Para as variações foram calculados parâmetros de variação da estabilidade da estrutura secundária do contexto das variações (??Gfolding), presença de sítios de ligação de fatores de transcrição (JASPAR), tipo de variação (transição/transversão, tipoV), distância do início da sequência codificante (DiSC), distância do início de transcrição (DiTr) e conservação filogenética por distância de Levenshtein do contexto (Lev). A estatística foi calculada pelos testes de Wilcoxon e Binomial. A partir destes foram gerados modelos de regressão logísticos analisados através de curva ROC. Os parâmetros ??Gfolding máximo, tipoV, DiSC, e Lev permitiram a distinção significativa (? = 0,05) entres os polimorfismos e as mutações permitindo modelos explicativos, mas incompletos (área da Curva ROC 0, 772). ??Gfolding max. indicou uma relação entre as mutações e entre estruturas secundárias mais estáveis geradas pelas mesmas. Os parâmetros Lev e tipoV sugerem a origem das mutações como resultantes de hotspots. O parâmetro DiSC indicou regiões com provável funcionalidade. Apesar de não ter sido possível estabelecer relação causal entre os parâmetros e o impacto funcional das variações, encontrou-se correlações importantes / Abstract: It is estimated that each individual carries about 120 to 430 rare variante in the UTR regions (Abecasis et al, 2012). Despite the increased tolerance towards variations in 5' UTR region, the patho-phisiology of several diseases is linked to its mutations (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010). Therefore it is necessary the understanding and the determination of the regulatory elements. The objective of this study is the discovery of genetic signatures found in the genomic context of disease causing point mutations in 5' UTR, thus allowing the prediction of the functional impact of other point variations in the same region. The disease causing mutations were selected from Human Gene Mutation Database (HGMD) (Stenson et al, 2008). The polymorphisms of unknown functional impact were obtained from the NHLBI Grand Opportunity Exome Sequencing Project (ESP), originated from the work of Tenessen et al (2012). A total of 235 mutations and 21,542 polymorphisms were used. For each variation, parameters related with the differences of the variation's context folding stability (??Gfolding), presence of transcription factor binding sites (JASPAR), type of variation (transition/transversion, tipoV), distance from coding sequence start (DiSC), distance from transcription start site (DiTr) and phylogenetic conservations by distance of Levenshtein from wild type to variant context (Lev). The statistical test was done by Wilcoxon and Binomial. Logistical regressions models were generated from the parameters and its performance was evaluated by a ROC curve. The parameters maximal ??Gfolding, tipoV, logarithm of DiSC and Lev allowed a significant distinction (? = 0,05) between the groups, generating models of reasonable explanation but incomplete (area under the ROC curve 0,772). Maximal ??Gfolding showed a relationship between mutations and stable secondary structures generated by them. Lev and tipoV suggested the origin of the mutation from hotspots. The DiSC parameter identified regions with possible functionality. While it was not possible to establish any clear causal relationship between the parameters and the functional impact of the variations, important correlations were found / Mestrado / Histologia e Embriologia / Mestre em Biologia Buco-Dental
118

Programação por restrições aplicada a problemas de rearranjo de genomas / Constraint programming applied to genome rearrangement problems

Iizuka, Victor de Abreu, 1987- 21 August 2018 (has links)
Orientador: Zanoni Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-21T22:58:04Z (GMT). No. of bitstreams: 1 Iizuka_VictordeAbreu_M.pdf: 1453681 bytes, checksum: 1fec01321d56a93084d2597366b44422 (MD5) Previous issue date: 2012 / Resumo: A teoria da seleção natural de Darwin afirma que os seres vivos atuais descendem de ancestrais, e ao longo da evolução, mutações genéticas propiciaram o aparecimento de diferentes espécies de seres vivos. Muitas mutações são pontuais, alterando a cadeia de DNA, o que pode impedir que a informação seja expressa, ou pode expressá-la de um modo diferente. A comparação de sequências é o método mais usual de se identificar a ocorrência de mutações pontuais, sendo um dos problemas mais abordados em Biologia Computacional. Rearranjo de Genomas tem como objetivo encontrar o menor número de operações que transformam um genoma em outro. Essas operações podem ser, por exemplo, reversões, transposições, fissões e fusões. O conceito de distância pode ser definido para estes eventos, por exemplo, a distância de reversão é o número mínimo de reversões que transformam um genoma em outro [9] e a distância de transposição é o número mínimo de transposições que transformam um genoma em outro [10]. Nós trataremos os casos em que os eventos de reversão e transposição ocorrem de forma isolada e os casos quando os dois eventos ocorrem simultaneamente, com o objetivo de encontrar o valor exato para a distância. Nós criamos modelos de Programação por Restrições para ordenação por reversões e ordenação por reversões e transposições, seguindo a linha de pesquisa utilizada por Dias e Dias [16]. Nós apresentaremos os modelos de Programação por Restrições para ordenação por reversões, ordenação por transposições e ordenação por reversões e transposições, baseados na teoria do Problema de Satisfação de Restrições e na teoria do Problema de Otimização com Restrições. Nós fizemos comparações com os modelos de Programação por Restrições para ordenação por transposições, descrito por Dias e Dias [16], e com as formulações de Programação Linear Inteira para ordenação por reversões, ordenação por transposições e ordenação por reversões e transposições, descritas por Dias e Souza [17] / Abstract: The Darwin's natural selection theory states that living beings of nowadays are descended from ancestors, and through evolution, genetic mutations led to the appearance of different kinds of living beings. Many mutations are point mutations, modifying the DNA sequence, which may prevent the information from being expressed, or may express it in another way. The sequence comparison is the most common method to identify the occurrence of point mutations, and is one of the most discussed problems in Computational Biology. Genome Rearrangement aims to find the minimum number of operations required to change one sequence into another. These operations may be, for example, reversals, transpositions, fissions and fusions. The concept of distance may be defined for these events, for example, the reversal distance is the minimum number of reversals required to change one sequence into another [9] and the transposition distance is the minimum number of transpositions required to change one sequence into another [10]. We will deal with the cases in which reversals and transpositions events occur separately and the cases in which both events occur simultaneously, aiming to find the exact value for the distance. We have created Constraint Programming models for sorting by reversals and sorting by reversals and transpositions, following the research line used by Dias and Dias [16]. We will present Constraint Logic Programming models for sorting by reversals, sorting by transpositions and sorting by reversals and transpositions, based on Constraint Satisfaction Problems theory and Constraint Optimization Problems theory. We made a comparison between the Constraint Logic Programming models for sorting by transpositions, described in Dias and Dias [16], and with the Integer Linear Programming formulations for sorting by reversals, sorting by transpositions and sorting by reversals and transpositions, described in Dias and Souza [17] / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
119

[en] EXECUTION AND DATA AVAILABILITY CONTROL FOR APPLICATIONS ON BIOLOGICAL SEQUENCES: THE CASE OF BLAST / [pt] CONTROLE DA EXECUÇÃO E DISPONIBILIZAÇÃO DE DADOS PARA APLICATIVOS SOBRE SEQÜÊNCIAS BIOLÓGICAS: O CASO BLAST

MAIRA FERREIRA DE NORONHA 25 April 2007 (has links)
[pt] Este trabalho consiste na criação de uma ferramenta provedora de dados para o BLAST, denominada BioProvider. Esta é usada para prover dados realizando um gerenciamento de buffer eficiente para o BLAST, controlando também o escalonamento dos processos do mesmo. A comunicação entre o BioProvider e os processos do BLAST, assim como o controle de concorrência e bloqueios, é feita por meio de um driver, que substitui as chamadas a funções de leitura e escrita de arquivos do banco de dados. Deste modo, o código do BLAST não precisa ser modificado para ser realizar a comunicação com o BioProvider e este pode ser usado para diferentes versões do BLAST. O desenvolvimento do BioProvider é a primeira etapa para a criação de uma solução aplicável também a outras ferramentas de Bioinformática. Por ser transparente aos programas, a ferramenta desenvolvida é facilmente extensível, podendo ser futuramente modificada para prover dados para outros aplicativos, usar outras estratégias de gerência de buffer ou prover dados armazenados em formatos diferentes dos lidos por processos clientes, convertendo-os em tempo de execução. O BioProvider foi testado com a versão recente do NCBI BLAST, obtendo consideráveis melhoras de desempenho, e seu funcionamento foi verificado também com a versão do WU-BLAST com código aberto. Foram realizadas análises de variações no algoritmo de gerenciamento de buffer e dos fatores que influenciam o desempenho dos processos BLAST. / [en] This work consists on the creation of a tool named BioProvider to provide data to BLAST. The tool provides the data using buffer management techniques that are efficient for BLAST and controls process scheduling. The communication between BioProvider and the BLAST processes, as well as the concurrency and blocking control, is done through a device driver that substitutes the read and write function calls to the database files. By this means, the application code can remain unchanged and BioProvider can be used with different versions of BLAST. The development of BioProvider was the first stage to the creation of a solution that can be applied as well to other Bioinformatics tools. Due to its transparency in the view of other applications, BioProvider can be easily extended in the future to provide data to other applications, to use other buffer management techniques or to provide data stored in different formats of those read by the client processes, converting the data in runtime. BioProvider has been tested with the most recent version of NCBI BLAST and considerable improvement has been verified. The tool has been shown to work as well with the open source version of WU-BLAST. Some variations on the buffer management algorithm were studied, as well as the different factors that influence the performance of BLAST processes.
120

Biologia computacional na identificação dos reguladores mestres da transcrição em câncer pancreático

Sartor, Ivaine Tais Sauthier January 2014 (has links)
O adenocarcinoma de ducto pancreático é reconhecido mundialmente como uma doença extremamente agressiva a qual apresenta um prognóstico desfavorável para pacientes sem cirurgia de ressecção. Portanto, é fundamental ampliar o conhecimento sobre os mecanismos biológicos envolvidos no câncer pancreático a fim de permitir a identificação de marcadores moleculares e alvos terapêuticos com o intuito de melhorar o diagnóstico precoce e tratamento. Os fatores de transcrição, reconhecidos por serem os efetores finais de vias de sinalização, regulam diversas funções celulares e, alterações na expressão transcricional destes podem contribuir para a transformação celular bem como para a progressão tumoral. Assim, o objetivo do presente estudo foi identificar os reguladores mestres da transcrição, possivelmente envolvidos no câncer pancreático. Para tanto, utilizamos dados de microarranjos para associar os reguladores mestres com o fenótipo tumoral. As análises foram realizadas no ambiente estatístico R utilizando os pacotes RTN, Limma e Survival. O gene TULP3 foi identificado como um regulador mestre da transcrição em amostras de câncer pancreático. O valor prognóstico de TULP3 foi verificado através de análises de sobrevivência em três coortes independentes. Estas análises revelaram que pacientes com adenocarcinoma pancreático, exibindo altos níveis de expressão do gene TULP3, apresentam uma sobrevida global desfavorável. Os altos níveis transcricionais de TULP3 podem desempenhar um papel fundamental na progressão do adenocarcinoma pancreático e conduzir a um resultado clínico desfavorável. Contudo, este estudo destaca a potencial aplicação de TULP3 como um biomarcador de prognóstico clínico para pacientes com adenocarcinoma pancreático. / Pancreatic ductal adenocarcinoma is world-wide recognized as an aggressive disease with poor prognosis in patients who did not undergo resection. Efforts to better comprehend the biological mechanisms of pancreatic cancer are needed to enable the identification of novel molecular markers and therapeutic targets for improving early diagnosis and treatment. Transcription factors are the final effectors of signaling pathways and regulate a number of cellular functions. Changes in expression of transcription factors may contribute to cellular transformation and tumor progression. Thus, the aim of the present study was to identify transcriptional master regulators potentially involved in pancreatic cancer disease. To achieve this goal, we utilized microarray data to associate master regulators with tumor phenotype. Analyses were performed with RTN, Limma, and Survival packages at R environment. We identified TULP3 as a master regulator of transcription in pancreatic cancer samples. TULP3 prognostic value was accessed in three independent cohort analyses. Our data demonstrate that patients with pancreatic cancer, exhibiting high TULP3 transcriptional levels, show a poor overall survival. High levels of TULP3 expression may play an essential role in pancreatic cancer progression and lead to poor clinical outcome. Our results highlight the potential use of TULP3 as a clinical prognostic biomarker for pancreatic adenocarcinoma.

Page generated in 0.1224 seconds