Global ETD Search

171	Similaridade estrutural de complexos peptídeo : MHC como um indicador para a ocorrência de reatividade cruzada Antunes, Dinler Amaral January 2014 (has links) A coevolução parasita-hospedeiro pode ser apontada como uma das principais responsáveis pela grande diversificação de genes envolvidos na resposta imunológica. A chamada “região do MHC” (na sigla em inglês para Major Histocompatibility Complex), localizada no braço curto do cromossomo 6 humano, é a região mais polimórfica e densa do nosso genoma. Os três genes mais polimórficos deste locus codificam a cadeia pesada de um complexo referido como MHC de classe I, responsável pela apresentação (na superfície celular) de peptídeos provenientes da degradação de proteínas intracelulares. Este mecanismo é central na resposta antiviral, permitindo que células infectadas sejam identificadas e eliminadas pelos Linfócitos T Citotóxicos. Apesar de estruturalmente similares, cada molécula de MHC apresenta maior afinidade por peptídeos com determinadas características bioquímicas. Assim, quanto maior a variabilidade de MHCs em uma dada população, menor o risco de que todos os indivíduos sejam incapazes de apresentar pelo menos alguns alvos derivados de um determinado vírus. Por outro lado, a resposta imunológica celular e a geração de memória contra este alvo apresentado pelo MHC, depende do reconhecimento específico deste complexo peptídeo:MHC (pMHC) por uma dada população de linfócitos. Neste trabalho empregamos ferramentas de bioinformática para realizar a análise estrutural de complexos pMHC, identificando propriedades envolvidas na estimulação da resposta imunológica celular. Nossos resultados in silico, corroborados por experimentos in vitro e ex vivo, sugerem que a similaridade estrutural de complexos pMHC (em termos de topografia e potencial eletrostático) desempenha um papel central na reatividade cruzada de linfócitos T, com implicações sobre imunidade heteróloga, imunopatologia e desenvolvimento de vacinas. / Host-pathogen coevolution can be implicated as one of the main features driving the great diversity of genes involved with immunological response. The so-called “MHC region” (Major Histocompatibility Complex), located at the short arm of human chromosome 6, is the most polymorphic and dense region of our genome. The three most polymorphic genes in this locus encode the heavy chain of a complex referred as MHC class I, which is responsible for presentation (at cell surface) of peptides derived from the digestion of cytosolic proteins. This mechanism plays a key role in antiviral immune response, allowing infected cells to be identified and eliminated by Cytotoxic T Lymphocytes. Although structurally similar, each MHC molecule presents higher affinity for peptides with certain biochemical properties. Therefore, the greater the variability of MHCs in a given population, the smaller the risk that all individuals are unable to present at least some targets derived from a given virus. On the other hand, cellular immune response and memory generation against the target presented by the MHC, depends on specific recognition of this peptide:MHC (pMHC) complex by a given T cell population. In this work, we use bioinformatics tools to perform structural analysis of pMHC complexes, identifying features involved in triggering cellular immune responses. Our in silico results, corroborated by in vitro and ex vivo experiments suggest that structural similarity among pMHC complexes (topography and electrostatic potential) plays a central role in cross-reactivity of cytotoxic T cells, with implications over heterologous immunity, immunopathology and vaccine development. Epitopos Bioinformática estrutural Linfócitos T
172	Repostas transcricionais e estresse-induzidas em genótipos constrastantes de Glycine max (soja) e Vigna unguiculata (feijão-caupi) BEZERRA NETO, João Pacifico 12 February 2016 (has links) Submitted by Rafael Santana (rafael.silvasantana@ufpe.br) on 2018-02-02T18:09:21Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) João Pacifico Bezerra Neto - PPGCB - Doutorado 2016.pdf: 6726842 bytes, checksum: e961cc72371215fdb0cc36db04b0fa89 (MD5) / Made available in DSpace on 2018-02-02T18:09:21Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) João Pacifico Bezerra Neto - PPGCB - Doutorado 2016.pdf: 6726842 bytes, checksum: e961cc72371215fdb0cc36db04b0fa89 (MD5) Previous issue date: 2016-02-12 / FACEPE / As plantas evoluíram para sobreviver em ambientes onde muitas vezes são impostas condições adversas, tais como estresses abióticos (temperatura, luz, seca, salinidade, frio), ou bióticos (vírus, bactérias, fungos e nematoides). Para sua sobrevivência, desenvolveram inúmeros mecanismos que permitem a detecção de mudanças ambientais, bem como a indução de respostas específicas às condições estressantes impostas, minimizando as perdas. Existem genes-chave nos mecanismos de adaptação, especialmente os relacionados à desintoxicação, à homeostase e à reprogramação dos padrões de expressão gênica, envolvendo mudanças em nível fisiológico. A identificação de genes-candidatos promissores para o melhoramento de espécies cultivadas com relação aos principais estresses ainda está aquém das necessidades. Assim, a identificação e caracterização de genes relacionados com a resposta vegetal a estresses foi realizada para as culturas da soja e do feijão-caupi, em seus respectivos transcriptomas, por métodos computacionais. Quando estão sob estresse, as plantas podem ativar respostas celulares, incluindo a produção de proteínas antioxidantes, com o intuito de minimizar os danos e evitar a ação tóxica de ROS (Espécies Reativas de Oxigênio) nas células vegetais. Neste contexto, foram identificados 1.273 transcritos em feijão-caupi e 451 transcritos em soja, distribuídos em 15 categorias de genes ROS que desempenham papéis importantes no estresse oxidativo. Estes genes compõem um grupo de enzimas antioxidantes que trabalham em conjunto para manter um nível de estado estacionário intracelular, promovendo o crescimento da planta, desenvolvimento, ciclo celular, a sinalização hormonal, reforçando respostas aos estressores ambientais abióticos e bióticos, semelhante ao observado em outras espécies de plantas. Além das ROS fatores de transcrição (FTs) representam um papel crucial, como os principais reguladores da tolerância vegetal ao estresse. Nesse contexto, foi realizada uma identificação das famílias de FTs, presentes no transcriptoma de duas variedades contrastantes de feijão-caupi (sensível e tolerante a seca). Foram identificados 4.822 transcritos, classificados em 64 famílias, com expressão diferencial nos diferentes tempos de exposição ao estresse e cultivares, exibindo indução da expressão em condições de estresse. As interações entre as famílias gênicas reguladoras e os genes regulados permitiram a criação de modelos computacionais para a compreensão da arquitetura e funcionamento da rede de regulação gênica vegetal frente ao estresse, permitindo a identificação eficiente de candidatos para o melhoramento vegetal e fins biotecnológicos. / Plants evolved to survive in environments that often impose adverse conditions, such as abiotic (temperature, light, drought, salinity, cold) and biotic stresses (viruses, bacteria, fungi and nematodes). For survival, they developed several mechanisms that enable the detection of environmental changes, as well as induction of specific responses to the imposed stress conditions, minimizing losses. There are key genes associated to adaptation mechanisms; especially those related to detoxification, homeostasis and gene expression patterns reprogramming, involving changes at physiological level. The identification of promising candidate genes for cultivated species improvement related to main stresses is still far from the necessities. Thus, the identification and characterization of genes related to plant response to stress was carried out for soybean and cowpea in their transcriptome by computational methods. When under stress, plants can activate cellular responses, including production of antioxidant proteins, in order to minimize damage and avoid toxic action of ROS (Reactive Oxygen Species) in plant cells. In this context, 1,273 transcripts were identified in cowpea and 451 transcripts in soybean, distributed into 15 ROS gene categories that play important roles in oxidative stress. These genes form a group of antioxidant enzymes that work in concert to maintain a steady intracellular level state, promoting plant growth, development, cell cycle, and hormonal signaling, reinforcing responses to biotic and abiotic environmental stressors, like observed in other plant species. Apart from ROS, transcription factors (TFs) play a crucial role as the primary regulators of plant stress tolerance. In this context, the identification of TF families was conducted for transcriptome data for two contrasting cowpea varieties (sensitive and tolerant to drought). 4,822 transcripts were identified, being classified into 64 families, differentially expressed in different times of exposure to stress and cultivars, exhibiting induction of expression under stress conditions. The interactions between regulatory gene families and regulated genes allowed the creation of computational models for understanding the architecture and operation of the plant against stress gene regulation network, allowing efficient identification of candidates for plant breeding and biotechnological purposes. Leguminosa Soja Feijão-caupi Bioinformática Regulação da expressão gênica
173	Identificação de bactérias do complexo Burkholderia cepacia através de utilização de ferramentas computacionais MONTEIRO, Josineide Neri 08 September 2016 (has links) Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-08-21T20:32:01Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Josineide Neri Monteiro.pdf: 2021284 bytes, checksum: 33052b504f3c70e6a33eb5267d37322b (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-29T17:42:19Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Josineide Neri Monteiro.pdf: 2021284 bytes, checksum: 33052b504f3c70e6a33eb5267d37322b (MD5) / Made available in DSpace on 2018-08-29T17:42:19Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Josineide Neri Monteiro.pdf: 2021284 bytes, checksum: 33052b504f3c70e6a33eb5267d37322b (MD5) Previous issue date: 2016-09-08 / CAPES / O gênero Burkholderia compreende bactérias gran-negativas, aeróbicas pertencentesà classe β-proteobacteria. Estudos de 16S rDNA revelaram que o gênero Burkholderia é composto por bactérias que, apesar de intimamente relacionadas e fenotipicamente muito similares, possuem múltiplas diferenças genéticas, suficientes para permitir subdivisões em espécies ou variantes genômicas, que formam o complexo B. cepacia. Dados biológicos, especialmente os de sequenciamento genômico, vêm sendo gerados em ritmo acelerado nas últimas décadas. Com o surgimento da Bioinformática, podemos aplicar técnicas computacionais para manipular dados biológicos. O alinhamento múltiplo de sequências (MAS) é um conjunto de técnicas utilizadas para entender informações biológicas de um conjunto de sequências sendo considerada a tarefa mais comum e mais importante da bioinformática, visto que pode fornecer consideráveis informações sobre estrutura e função de genes. Os algoritmos genéticos (AGs) permitem uma simplificação na formulação e solução de problemas de otimização visto que incorporam uma solução potencial para um problema específico numa estrutura semelhante à de um cromossomo e aplicam operadores de seleção e cruzamento a essas estruturas de forma a preservar informações críticas relativas à solução do problema. O presente trabalho objetivou aplicar técnicas computacionais visando solucionar o problema de alinhamento genético de sequências biológicas de DNA de bactérias do complexo Burkholderia cepacia. As sequências analisadas (586) foram obtidas através do banco de dados GenBank do National Center for Biotechnology Information (NCBI). Para alinhamento das sequências, utilizou-se as seguintes ferramentas: Clustal ômega e Kalign. Das ferramentas utilizadas, nenhuma conseguiu gerar dados de boa acurácia. Desse modo, conclui-se que existe a necessidade de desenvolvimento de novos algoritmos/ferramentas de alinhamento genético visando trabalhar com grande quantidade de dados para obtenção de uma otimização. Para o caso de várias sequências, o problema do alinhamento múltiplo é considerado NP-difícil. Desse modo, foi observado que é necessário desenvolver novos algoritmos, para sua resolução em tempo hábil buscando sempre soluções bem aproximadas da solução ótima. / The genus Burkholderia comprises gran-negative bacteria, aerobic belonging to β-proteobacteria class. 16S rDNA analyzes have revealed that the genus Burkholderia is composed of bacteria which, although closely related and phenotypically very similar, have multiple genetic enough differences to allow subdivisions species or genomic variants that constitute the B. cepacia complex. Biological data, especially the genomic sequencing, are being generated at a rapid pace in recent decades. With the emergence of bioinformatics, we can apply computational techniques to manipulate biological data. The multiple sequence alignment (MAS) is a set of techniques used to understand biological information from a set of sequences is considered the most common and most important task of bioinformatics, since it can provide considerable information about the structure and function of genes. AGs allow a simplification in the design and optimization of troubleshooting as incorporate a potential solution to a specific problem in a structure similar to a chromosome and apply selection and crossover operators such critical information to preserve the form of structures for the solution problem. This study aimed to apply computational techniques aimed at solving the genetic alignment problem of biological DNA sequences of bacteria Burkholderia cepacia complex. The sequences analyzed (586) were obtained from the GenBank database of the National Center for Biotechnology Information (NCBI). For aligning the sequences, the following tools were used: Clustal omega and Kalign. The tools used, none was able to generate good data accuracy. Thus, it is concluded that there is a need to develop new algorithms / alignment tools genetic targeting working with large amounts of data to obtain an optimization. In the case of multiple sequences, the problem of multiple alignment is considered to be NP-hard. Thus, it was observed that it is necessary to develop new algorithms for its resolution in a timely manner and always seeking approximate solutions of the optimal solution. Engenharia Biomédica Burkholderia Bioinformática Alinhamento genético Algoritmos genéticos Taxonomia
174	A DEFINIÇÃO DE UMA ONTOLOGIA PARA INTEGRAR DADOS DE INTERATOMA E TRANSCRIPTOMA DE CÂNCER Cabral, Heleno Carmo Borges 23 June 2010 (has links) Made available in DSpace on 2018-06-27T18:56:06Z (GMT). No. of bitstreams: 3 Heleno Carmo Borges Cabral.pdf: 5857862 bytes, checksum: d2951b87950c843d49760204923bdc2a (MD5) Heleno Carmo Borges Cabral.pdf.txt: 118091 bytes, checksum: e4e222642f43d380a5e6bf3a2acd2aac (MD5) Heleno Carmo Borges Cabral.pdf.jpg: 3434 bytes, checksum: 3c397ca213b4291d6533cce010f30ed4 (MD5) Previous issue date: 2010-06-23 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Ontocancro is an ontology stored in a knowledge database designed to be a source of information to integrate transcriptomics and interatomics data involved in gene pathways of genome maintenance/stability mechanisms (GMM). Genome maintenance mechanisms are shown to be critical for cell homeostasis since their malfunctioning can predispose to cancer. Repair, apoptosis and chromosome stability pathways comprise the cornerstone of GMM. The information about these pathways are disseminated in various databases as NCI-Nature, BioCarta, KEGG, Reactome, Prosite, GO and others. Ontocancro was created with the intention of integratin the information of genes involved in GMM from several curated databases. This data integration is difficult for biological data lack a unified vocabulary and need constant update what is provided by Ontocancro. Additionally, it allows the integration of transcriptome data provided by some Affymetrix microarrays platforms with interactome data from the STRING database, which has information about protein interactions. So, this work shows the integration of data from biological information systems using the ontology paradigm, in order to integrate transcriptomics and interatomics data involved in gene pathways of genome stability. / A Ontocancro é uma ontologia armazenada em um banco de dados de conhecimento projetada para ser a fonte de informação referente a integração de dados de interatoma e transcriptoma envolvidos em vias metabólicas de mecanismo de manutenção do genoma humano (GMM). Esse mecanismo de manutenção são críticos para homeostase celular desde o seu mau funcionamento, o que pode causar câncer. O reparo, a apoptose e as vias de estabilidade cromossômicas compreendem o cerne do GMM. A informação sobre essas vias metabólicas são disseminadas em vários bancos de dados, como o NCI-Nature, o BioCarta, o KEGG, o Reactome, o Prosite e o GO, entre outros. A ontologia Ontocancro foi criada com a intenção de integrar a informação sobre os genes envolvidos em GMM a partir de diversos bancos de dados curados. Essa integração de dados é complexa pela falta de um vocabulário sobre os dados biológicos e a necessidade constante de atualização destes dados. Para sanar essas duas dificuldades, a Ontocancro foi criada. Adicionalmente, ela permite a integração de dados oriundos de transcriptoma obtidos a partir da plataforma Affymetrix com os dados de interatoma obtidos a partir do banco de dados chamado STRING, o qual possui informação sobre as interações entre as proteínas. Portanto, este trabalho apresenta a integração de dados obtidos de sistemas de informação biológicos usando o paradigma ontológico, de forma a integrar os dados envolvidos em interatoma e transcriptoma em vias metabólicas de estabilidade do genoma. Bioinformática Câncer Ontologias Bioinformatics Cancer Ontologies CNPQ::ENGENHARIAS
175	Aplicação de modelos estatísticos e desenvolvimento de algoritmos para estudo genético de doenças neuro-psiquiátricas / Statistical models application and algorithm development for genetic studies in neuropsychiatric diseases Secolin, Rodrigo 02 August 2011 (has links) Orientador: Iscia Teresinha Lopes Cendes / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Ciências Médicas / Made available in DSpace on 2018-08-17T11:06:08Z (GMT). No. of bitstreams: 1 Secolin_Rodrigo_D.pdf: 5866562 bytes, checksum: 5079bfd5d88341ce619480ba6e19fb16 (MD5) Previous issue date: 2011 / Resumo: Fatores genéticos têm sido descritos para diversas doenças do sistema nervoso central. Uma etapa importante na identificação de genes responsáveis por estas doenças são os estudos de mapeamento genético. Além disso, devido às novas tecnologias de aquisição de dados de genótipos dos indivíduos, é necessário o estudo e desenvolvimento de programas de processamento de grande quantidade de dados para as análises estatísticas. Os objetivos deste trabalho foram: 1) criar uma interface entre os equipamentos de aquisição de dados de genótipos e os programas estatísticos, por meio de programas de processamento de dados; 2) aplicar e avaliar os modelos estatísticos em amostras de famílias segregando três doenças neuro-psiquiátricas: epilepsia do lobo temporal mesial (ELTM), polimicrogiria perisylviana bilateral congênita (PPBC) e transtorno afetivo bipolar (TAB). A interface foi desenvolvida a partir de um algoritmo lógico, o qual adiciona a matriz dos dados dos genótipos provenientes dos equipamentos em uma matriz representativa dos dados das famílias. Este algoritmo, denominado JINGLEFIX, foi programado em linguagem de computador PERL e ambiente R e utilizado posteriormente nos estudos de mapeamento genético da ELTM, PPBC e TAB. Análise de segregação foi realizada em 148 famílias nucleares com ELTM, com um total de 698 indivíduos, visto que esta síndrome não possui padrão de herança conhecido. Uma família, segregando PPBC com um total de 15 indivíduos e um padrão conhecido de herança ligada ao X dominante, foi submetida à análise paramétrica de ligação por meio do pacote de programas LINKAGE, utilizando 18 marcadores microssátelites na região candidata Xq27-Xq28. Análise não paramétrica de ligação realizada em uma amostra de 74 famílias segregando TAB, totalizando 411 indivíduos, por meio do teste de transmissão de desequilíbrio de ligação (TDT), utilizando 21 single nucleotide polymosphisms (SNPs) para 21 regiões candidatas. A análise de segregação revelou a presença de um gene de maior efeito com um padrão autossômico dominante, além da presença de genes de menor efeito influenciando no fenótipo da ELTM. O posterior mapeamento genômico da ELTM, utilizando os parâmetros definidos na análise de segregação, revelou ligação genética na região 18p11. A análise paramétrica de ligação genética levou ao mapeamento da região Xq27 para a família com PPBC, diferente da região candidata previamente descrita. Esta diferença pode ser explicada pelo tipo de amostra familiar utilizada pelos dois estudos. Em relação ao TAB, a análise não paramétrica identificou a região candidata 3p22. Posterior estudo de refinamento da região 3p21-3p22 utilizando 94 SNPs adicionais e estudo de expressão gênica identificou o gene ITGA9 como possível gene de susceptibilidade para o TAB. Comparando o poder estatístico entre as análises, foi observado maior poder estatístico na análise paramétrica utilizando uma ou poucas famílias, com um número grande de indivíduos por família; enquanto que o poder estatístico foi maior nas análises não paramétricas utilizando múltiplas famílias de tamanhos moderados e estruturas variadas. Conclui-se que o algoritmo de processamento de dados e a adequada aplicação dos modelos estatísticos são fundamentais para sucesso do mapeamento genético das regiões e dos genes responsáveis pelas doenças neuro-psiquiátricas estudadas / Abstract: Genetic factors have been described for several central nervous system diseases. A main step for disease gene identification is genetic mapping study. In addition, due new genotype acquire technology, the development of genotype processing data software is required. The objectives of this work were: 1) to generate interface between genotype equipment and statistical software by processing data algorithm; 2) to apply and evaluate statistical models in family sample segregating three neurological diseases: mesial temporal lobe epilepsy (MTLE), bilateral perysilvian polymicrogyria (BPP) and bipolar affective disorder (BPAD). Data interface was developed from a logic algorithm, which adds a genotype matrix data from equipment to a family data matrix. This algorithm, called JINGLEFIX, was implemented in PERL computer language and R environment. In addition, this software was used in genetic mapping study for MTLE, BPP and BPAD. Segregation analysis was performed in 148 nuclear MTLE pedigrees, with a total of 698 individuals, since this syndrome has not known inheritance pattern. One BPP pedigree with known X-linked dominant pattern of inheritance, with a total of 15 individuals, was submitted to parametric linkage analysis by LINKAGE package, using 18 microsatellite markers on candidate region Xq27-Xq28. Non-parametric linkage analysis was performed from 74 BPAD families, with a total of 411 individuals, by transmission disequilibrium test (TDT) and using 21 single nucleotide polymorphisms (SNPs) for 21 candidate regions. Segregation analysis revealed a major effect gene with an autosomal dominant pattern of inheritance and minor gene effect, which could influence MTLE phenotype. Further whole genome analysis mapped the putative MTLE major gene on 18p11. Parametric linkage analysis mapped Xq27 locus for BPP, a different region compared to the Xq28 previous described. This difference could be explained to sample type used by the two studies. Non-parametric linkage for BPAD identified the candidate region on 3p22. Further studies using 94 additional SNPs on 3p21-3p22 and gene expression analysis identified ITGA9 as susceptibility gene for BPAD. A comparison of statistical power between statistical analyses showed a high statistical power for parametric linkage analysis from one or a few large families; whereas a high statistical power was observed for non-parametric linkage analysis using several moderate size families. The conclusion of this study is that data processing algorithm and adequate statistical model applying are fundamental tools for successful of genetic mapping of complex diseases / Doutorado / Neurociencias / Doutor em Ciências Bioinformática Genética médica Neurogenética Bioinformatics Human genetics Neurogenetics
176	Uma abordagem computacional para determinação de polimorfismo de base unica / A computational approach for single nucleotide polymorphism discovery Galves, Miguel 12 January 2006 (has links) Orientador: Zanoni Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-08T13:30:41Z (GMT). No. of bitstreams: 1 Galves_Miguel_M.pdf: 5199577 bytes, checksum: 4d8728b3e0fef3fa3caf69a78187f76a (MD5) Previous issue date: 2006 / Resumo: A pesquisa genomica é de grande interesse para area medica. Por isso o entendimento de como os genes influenciam na aparição de doencas é de grande relevancia para a criação de metodos de diagnostico e criação de drogas apropriadas. A maioria dos genes apresenta uma grande frequencia de variações alelicas, conhecida como polimorfismo. Estas variações podem ser a chave para a predisposição de certos indiv?duos a certas doenças. Dentre os polimorfismos, os SNPs tem uma grande importancia, por representarem cerca de 90% dos polimorfismos encontrados no genoma humano [21]. Neste trabalho iremos estudar tres etapas no processo de detecção e analise de SNPs. A primeira etapa consiste no processo de alinhamento de sequencias de EST e cDNA com DNA genomico. A identificaçãode genes em sequencias de DNA não-caracterizadas é um dos grandes problemas na pesquisa genomica. Os algoritmos tradicionais [45, 55, 83, 84, 106] descrevem metodos para alinhar duas sequencias arbitrarias. Iremos descrever as estrategias de alinhamento de duas sequencias, discutir os metodos existentes para alinhamento de cDNA com DNA genomico e propor um conjunto de coeficientes apropriados a serem usados com os algoritmos classicos para resolver este tipo de alinhamento. A segunda etapa consiste na detecção de SNPs, seja atraves de alinhamentos multiplos ou da analise de cromatogramas. Iremos descrever o funcionamento dos dois metodos citados acima e discutir uma nova metodologia para detectar SNPs em sequencias de v?rus HIV. A terceira etapa consiste em correlacionar SNPs. Sabe-se que a predisposição genetica para muitas doenças não é devido a apenas uma mutação, ou presença ou não de um certo alelo. Em muitos casos, varios SNPs agem em conjunto e aumentam ou não a chance de uma doença se manifestar em um indiv?duo. Assim, é muito importante desenvolver metodos de correlação entre diversos SNPs para se entender como eles interagem entre si. Iremos descrever medidas de correlação e estudar a presença de LDs e LDs multiplos em genes da cana-de-açucar, mapeados pelo projeto SUCEST, e em genes humanos / Abstract: Genomic research is of great interest in the medical field. Therefore, understanding how genes impact the ocurrence of diseases is of significant relevance, so that proper diagnosis can be made and appropriate drugs can be developed. Most genes present great variantion and allele frequency, known as polymorphism. These variantions may be key to understanding the predisposition in individuals to certain diseases. Among polymorhisms, SNPs are of great importance, representing circa 90% of all polymorphism found in the human genome. [21]. For this work, we will study three phases in the process of detecting and analysis of SNPs. The first phase consists in the process of aligning EST sequences and cDNA to genomic DNA. Identiying genes in non-caracterized DNA sequences is one of the challenging problems in genomic research. Traditional algorithms [45, 55, 83, 84, 106] describe methods to align two arbitrary sequences. We shall describe alignment strategies of two sequences, discuss over existing existing methods for aligning cDNA with genomic DNA and propose a set of apropriate coefficients to be used in the classical algorithms to perform this kind of alignment. The seconde phase consists in detecting SNPs, whether through multiple alignments or cromatogram analysis. We shall describe how the two above mentioned methods work and discuss a new methodology to detect SNPs and HIV sequences. The third phase consists of correlating SNPs. It is known that the genetic predisposition for many diseases is not only due to a single mutation, or to the presence or absence of a single allele. In many cases, several SNPs act together and may increase or decrease the chance for a disease to manifest in a individual. Thus, it is very important to develop methods of correlation between SNPs to better understand how they interact. We shall describe correlation measures and study the presence of LD or multiple LDs in sugarcane genes,which were mapped by the SUCEST project, and in human genes / Mestrado / Biologia Computaçional / Mestre em Ciência da Computação Bioinformática Polimorfismo (Genética) Confiabilidade (Probabilidades) Bioinformatics Genetic polymorphisms Reliability
177	Comparação algebrica de genomas : o caso da distancia de reversão / Algebraic genome comparison : the case of reversal distance Almeida, André Atanasio Maranhão, 1981- 23 February 2007 (has links) Orientador: João Meidanis / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-08T13:34:53Z (GMT). No. of bitstreams: 1 Almeida_AndreAtanasioMaranhao_M.pdf: 3188069 bytes, checksum: b0743bc208c47e2d263f7d5503c22c07 (MD5) Previous issue date: 2007 / Resumo: Nas últimas décadas presenciamos grandes avanços na biologia molecular que levaram ao acúmulo de um grande volume de dados acerca de moléculas, tais como DNAs e proteínas, essenciais para a vida e para seu entendimento.O estágio atual é de busca por ferramentas que permitam extrair informações com relevância biológica destes dados. Neste contexto, a comparação de genomas surge como uma das ferramentas e nesta categoria incluímos rearranjo de genomas. Em rearranjo, o genoma é representado por uma seqüência de blocos conservados e, dados dois genomas e um conjunto de operações, busca-se pela que transformem um genoma no outro. Em 1995, Hannenhallie Pevzner apresentaram o primeiro algoritmo polinomial para o problema da ordenação por reversões orientadas. Tal algoritmo executa em tempo O(n4) e foi o primeiro algoritmo polinomial para um modelo realístico de rearranjo de genomas. Desde então, surgiram algoritmos que apresentam desempenho assintoticamente melhor. O melhor deles, apresentado por Tannier e Sagot em 2004, é capaz de executar em tempo O (n(n log n)1/2). Há um algoritmo linear, desenvolvido por Bader e colegas[2], mas este capaz de determinar a seqüência de reversões, apenas calcula a distância. Motivado pela carência de uma derivação algébrica mais formal da teoria desenvolvida em rearranjo de genomas, desenvolvemos uma solução formal para o problema da distância de reversão com sinal. Utilizamos, em tal solução, um formalismo algébrico para rearranjo de genomas que relaciona a recente teoria de rearranjo de genomas ?basicamente fundamentada no trabalho de Hannenhalli e Pevzner ? e a teoria de grupos de permutação de uma nova forma. Pretendemos criar a base para grandes avanços na área através de um formalismo algébrico forte / Abstract: In the last decades we have seen a great progress in molecular biology. That lead to a large volume of data on molecules, DNA and proteins, essential for life.The current stage of research lies in the pursuit of tools to extract information with biological relevance from this data. In this context, comparison of genomes is an important tool and genome rearrangements is a way of doing that comparison. In rearrangement analysis the genome is represented by a sequence of conserved blocks. The aim is to ?nd a minimum sequence of operations that transform a genome into another given as input two genomes and a set of allowed operations. In 1995, Hannenhalli and Pevzner presented the ?rst polinomial algorithm for sorting signed permutations by reversals. This algorithm has complexity O(n4) in time and was the ?rst polinomial algorithm for a realistic model of genome rearrangement. Since then, new algorithms with better asintotic performance had appeared. The fastest algorithm, with complexity O(n?n logn), was developed byTannier and Sagot in 2004. Motivated by a lack of a more formal derivation in the genome rearrangement developed theory, we developed a formal solution for the signed reversal distance problem. We use an algebraic formalism that relates the recent genome rearrangement theory ? basically based on a work of Hannenhalli and Pevzner ? to permutation group theory in a new form. We intend to build a solid theoretical base for further advances in the area through strong algebraic formalism / Mestrado / Teoria da Computação / Mestre em Ciência da Computação Biologia computacional Bioinformática Evolução molecular Computational biology Bioinformatics Molecular evolution
178	Gerenciamento de workflows cientificos em bioinformatica / Management of bioinformatics scientific workflows Digiampietri, Luciano Antonio 03 August 2007 (has links) Orientadores: João Carlos Setubal, Claudia Bauzer Medeiros / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-08T21:21:44Z (GMT). No. of bitstreams: 1 Digiampietri_LucianoAntonio_D.pdf: 2647979 bytes, checksum: cb55c9b2b4185459d26541f301c5dd5b (MD5) Previous issue date: 2007 / Resumo: Atividades em bioinformática estão crescendo por todo o mundo, acompanhadas por uma proliferação de dados e ferramentas. Isto traz novos desafios, por exemplo, como entender e organizar esses recursos, como compartilhar e re-usar experimentos bem sucedidos (ferramentas e dados), e como prover interoperabilidade entre dados e ferramentas de diferentes locais e utilizados por usuários com perfis distintos. Esta tese propõe uma infra-estrutura computacional para resolver tais problemas. A infra-estrutura permite projetar, re-usar, anotar, validar, compartilhar e documentar experimentos de bioinformática. Workflows científicos são os mecanismos utilizados para representar tais experimentos. Combinando pesquisa em bancos de dados, workflows científicos, inteligência artificial e Web semântica, a infra-estrutura se beneficia do uso de ontologias para permitir a especificação e anotação de workflows de bioinformática e para servir como base aos mecanismos de rastreabilidade. Além disso, ela usa técnicas de planejamento em inteligência artificial para prover as composições automática, iterativa e supervisionada de tarefas para satisfazer as necessidades dos diferentes tipos de usuários. Os aspectos de integração de dados e interoperabilidade são resolvidos combinando o uso de ontologias, mapeamento entre estruturas e algoritmos de casamento de interfaces. A infra-estrutura foi implementada em um protótipo e validada com dados reais de bioinformática / Abstract: Bioinformatics activities are growing all over the world, following a proliferation of data and tools. This brings new challenges, such as how to understand and organize these resources, how to exchange and reuse successful experimental procedures (tools and data), and how to provide interoperability among data and tools across different sites, and used for users with distinct profiles. This thesis proposes a computational infrastructure to solve these problems. The infrastructure allows to design, reuse, annotate, validate, share and document bioinformatics experiments. Scientific workflows are the mechanisms used to represent these experiments. Combining research on databases, scientific workflows, artificial intelligence and semanticWeb, the infrastructure takes advantage of ontologies to support the specification and annotation of bioinformatics workflows and, to serve as basis for traceability mechanisms. Moreover, it uses artificial intelligence planning techniques to support automatic, iterative and supervised composition of tasks to satisfy the needs of the different kinds of user. The data integration and interoperability aspects are solved combining the use of ontologies, structure mapping and interface matching algorithms. The infrastructure was implemented in a prototype and validated on real bioinformatics data / Doutorado / Sistemas de Informação / Doutor em Ciência da Computação Bioinformática Gerenciamento da informação Fluxo de trabalho Bio-informatics Information management Workflow
179	Estudo de variações genômicas para a identificação de biomarcadores personalizados e novos alvos terapêuticos em tumores colorretais / Study of genomic variation to identify biomarkers and novel therapeutic targets in colorectal tumors Elisa Rennó Donnard Moreira 06 August 2014 (has links) O câncer colorretal é um dos tipos de tumores mais frequentes no mundo. A atual dificuldade na avaliação correta da resposta ao tratamento torna necessário o desenvolvimento de novas abordagens de detecção tumoral. Atualmente, o sequenciamento genômico em larga escala permite um estudo mais compreensivo das alterações estruturais e de sequência presentes no tumor. A aplicação destas abordagens de maneira personalizada permite o desenvolvimento de biomarcadores tumor específicos que podem facilitar a avaliação de resposta ao tratamento e a presença de doença residual, bem como revelar alterações de sequência em genes capazes de servir de novos alvos terapêuticos. Neste estudo foi desenvolvida uma metodologia eficiente para a identificação de biomarcadores baseados na existência de variações estruturais em genomas de tumores de reto, eliminando a necessidade de sequenciamento do genoma normal do mesmo paciente e diminuindo portanto o custo da abordagem. Os biomarcadores encontrados para cada um dos seis pacientes foram utilizados para avaliar a presença de doença residual após o tratamento através da detecção de DNA tumoral circulante nas amostras de plasma coletadas em momentos diferentes do tratamento. O sequenciamento em baixa cobertura personalizado é portanto uma alternativa viável e promissora para avaliar a resposta ao tratamento em pacientes com tumores de reto. Na segunda parte do estudo, a análise de linhagens celulares de tumores colorretais revelou uma grande quantidade de mutações pontuais somáticas (SNVs e InDels) em genes codificadores para proteínas de superfície celular (surfaceoma). Estas alterações no surfaceoma indicam potenciais novos alvos para drogas e vias regulatórias alteradas neste tipo de tumor. Além disso, estas mutações pontuais também são responsáveis pela geração de epítopos com potencial imunogênico e estes novos epítopos podem ser aplicados como vacinas antitumorais personalizadas e já haviam sido propostos como uma alternativa terapêutica. A presença de novos epítopos, principalmente nas linhagens com elevadas taxas de mutação (resultante da instabilidade de microssatélites e mutações em genes de reparo de DNA tipo mismatch ou POLE), sugerem também um potencial uso de drogas moduladoras do sistema imune em pacientes com tumores que apresentam estas mesmas características. Portanto, o estudo de alterações genômicas em tumores primários e linhagens de câncer colorretal permitiu a detecção de variações estruturais que foram utilizadas como biomarcadores personalizados em pacientes com tumores de reto assim como a identificação de genes contendo mutações pontuais em linhagens celulares de câncer colorretal, que revelam potenciais novos alvos terapêuticos a serem explorados na clínica / Colorectal cancer is one of the more frequent tumor types in the world. To select the appropriate treatment course, it is necessary to develop more precise diagnostic approaches. The current availability of high throughput genome sequencing methods allows for a comprehensive characterization of the structural and sequence alterations present in each tumor. The use of tumor genome sequencing in a personalized setting can result in tumor specific biomarkers that help evaluate response to treatment and the presence of residual disease, improving the clinical management of these patients, and also reveal sequence alterations in genes capable of serving as new therapeutic targets. In this study we developed an efficient bioinformatics pipeline to identify biomarkers based on the existing structural alterations in rectal tumor genomes, eliminating the need to sequence the matched normal genome and therefore reducing the cost for this approach. The biomarkers found for each of the six patients were used to evaluate the presence of residual disease after treatment through the detection of circulating tumor DNA in plasma samples collected at different points during the treatment. Sequencing tumor genomes with low coverage is therefore a viable and promising alternative to follow up rectal cancer patient\'s response to treatment. In the second part of this study, the analysis of colorectal cancer cell lines revealed a large quantity of point mutations (SNVs and InDels) in genes coding for proteins located in the cell surface (surfaceome). These alterations in the surfaceome indicate potential new drug targets and altered pathways in this type of tumor. Furthermore, these point mutations are also responsible for the generation of new epitopes with immunogenic potential and these new epitopes can be applied as personalized tumor vaccines and had previously been proposed as a therapeutic alternative. The presence of new epitopes, especially in the cell lines with elevated mutation rates (resulting from MSI and mutations in DNA mismatch-repair genes or POLE), suggests a potential use of immune checkpoint target drugs in patients with tumors that share these genetic characteristics. With a large-scale bioinformatics approach, we detected new tumor epitopes resulting from point mutations, present in most of the cell lines used. The analysis of gene expression data puts into perspective both the somatic mutations found and which targets are promising as well as the development of therapies based on vaccines derived from tumor epitopes. In conclusion, the study of genomic alterations in primary tumors and colorectal cancer cell lines allowed the detection of structural variations that were used as personalized biomarkers in patients with rectal tumors as well as the identification of genes containing point mutations in colorectal cancer cell lines, that reveal potential new therapeutic targets to be explored in the clinical setting. Bioinformática Biomarcadores Câncer Genoma Mutações Bioinformatics Biomarkers Cancer Genome Mutations
180	Bioinformática estrutural aplicada à evolução das glutationas transferases / Structural Bioinformatics Applied to the Evolution of Glutathione Transferases Andréa Guelfi 09 March 2006 (has links) As glutationas transferases compõem uma superfamíla de proteínas que atuam na fase II do sistema de desintoxicação das células. Participam principalmente através do processo de conjugação da glutationa com moléculas hidrofóbicas e eletrofílicas, como por exemplo os herbicidas. No entanto, outras funções foram descritas como a tolerância ao estresse oxidativo, inseticidas, antibióticos microbianos, transporte de produtos secundários tóxicos, sinalização da célula durante as respostas ao estresse e fenômenos de resistência envolvendo agentes de quimioterapia contra o câncer. Nesta tese procurou-se estabelecer uma relação entre a seqüência, estrutura, função e afinidade das GSTs. A estrutura, de modo geral, determina a função da enzima, mas por si só, não dita sua especificidade. Esta última informação é fundamental para o desenvolvimento de novos agroquímicos ou para o desenho racional de novas proteínas. A relação entre a seqüência, estrutura, função e afinidade mostra que o paradigma estrutura-função deveria ser ampliado para incluir a seqüência de aminoácidos e a afinidade da enzima. Apesar da grande diversidade de substratos e seqüências encontradas nas GSTs há pelo menos um caso de convergência funcional em duas classes distintas desta superfamília. Uma encontrada apenas no reino Animalia (classe Pi) e outra exclusiva do reino Plantae (classe Phi). Ferramentas da bioinformática estrutural, como docking molecular e minimização de energia foram utilizadas para analisar as interações entre a enzima e o substrato. Estas ajudam a explicar como duas proteínas com aproximadamente 22% de identidade de seqüência apresentam afinidades semelhantes. Finalmente, foram propostos mutantes da GST de Saccharum officinarum utilizando a informação estrutural da enzima, visando uma alteração na afinidade da mesma. / Glutathione Transferases comprehend a superfamily of proteins that plays the phase II of the detoxification system of the cells. Their major catalysis is the conjugation of glutathione with hydrophobic and eletrophilic molecules, for example herbicides. However, other functions were described like oxidative stress, insecticides, microbial antibiotics, transport of secondary products, cells signalization during response to stress and resistance of chemotherapy drugs against cancer. This work aimed to establish a relation between sequence, structure, function and affinity of GSTs. The structure, in general, determines the function, but alone, can not determine the enzyme specificity. This last information is essential to the development of new agrochemicals or for the rational design of proteins. The relation between sequence, structure, function and affinity shows that the paradigm of structure-function should be enlarged in order to include the information of amino acid sequences and the enzyme affinities. Despite the wide variety of substrates and sequences found in the GSTs, there is at least one case of functional convergence between two distinct classes in this superfamily. One is found in the Animalia kingdom (class Pi) and the other is exclusively found in Plantae (class Phi). The structural bioinformatic tools, such as molecular docking and energy minimization were used to analyze the interactions between the enzyme and the substrate. These help to understand how two enzymes with approximately 22% of sequence identity can show the same affinities. Finally, GST mutants of Saccharum officinarum were proposed, using the enzyme structural information in order to modify the enzyme affinities. bioinformática glutationa transferase proteínas evolução bioinformatics glutathione tranferose porteins - evolution

Search results