• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
321

Alinhamento múltiplo progressivo de sequências de proteínas / Progressive multiple alignment of protein sequences

Souza, Maria Angélica Lopes de 16 August 2018 (has links)
Orientador: Zanoni Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-16T22:45:38Z (GMT). No. of bitstreams: 1 Souza_MariaAngelicaLopesde_M.pdf: 2988201 bytes, checksum: 0742d490b058c7a3dae6fddd7314aba4 (MD5) Previous issue date: 2010 / Resumo: O alinhamento múltiplo dc sequências é uma tarefa de grande relevância cm Bioin-formática. Através dele é possível estudar eventos evolucionários c restrições estruturais ou funcionais, sejam de sequências de proteína, DNA ou RNA, tornando possível entender a estrutura, função c evolução dos genes que compõem um organismo. O objetivo do alinhamento múltiplo é a melhor representação do cenário dc evolução das sequencias ao longo do tempo, considerando a possibilidade dc ocorrerem diferentes eventos de mutação. Encontrar um alinhamento múltiplo dc sequencias ótimo é um problema NP-Difícil. Desta forma, diversas abordagens têm sido desenvolvidas no intuito de encontrar uma solução heurística que represente da melhor maneira possível o cenário dc evolução real, dentre elas está a abordagem progressiva. O alinhamento progressivo c uma das maneiras mais simples dc se realizar o alinhamento múltiplo, pois utiliza pouco tempo c memória computacional. Ele c realizado cm três etapas principais: determinar a distância entre as sequências que serão alinhadas, construir uma árvore guia a partir das distâncias c finalmente construir o alinhamento múltiplo. Este trabalho foi desenvolvido a partir do estudo de diferentes métodos para realizar cada etapa dc um alinhamento progressivo. Foram construídos 342 alinhadores resultantes da combinação dos métodos estudados. Os parâmetros dc entrada adequados para a maioria dos alinhadores foram determinados por estudos empíricos. Após a definição dos parâmetros adequados para cada tipo dc ahnhador, foram realizados testes com dois subconjuntos de referencia do BAliBASE. Com esses testes observamos que os melhores alinhadores foram aqueles que utilizam o agrupamento dc perfil para gerar o alinhamento múltiplo, com destaque paTa os que utilizam pontuação afim para penalizar buracos. Observamos também, que dentre os alinhadores dc agrupamento por consenso, os que utilizam função logarítmica, para penalizar buracos demonstraram melhores desempenhos / Abstract: The multiple sequence alignment is a relevant task in Bioinf'ormatics. Using this technique is possible to study evolutionary events and also structural or functional restrictions of protein, DNA, or RNA sequences. This study helps the understanding of the structure, function, and evolution of the genes that make up an organism. The multiple sequence alignment tries to achieve the best representation of a sequence evolution scenario, considering different mutation events occurrence. Finding an optimal multiple sequence alignment is a NP-Hard problem. Thus, several approaches have been developed in order to find an heuristic solution that represents the real evolution cenário, such as the progressive approach. The progressive alignment is a simple way to perform the multiple alignment, because its low memcny usage and computational time. It is performed in three main stages: (i) determining the distance between the sequences to be aligned, (ii) constructing a guide tree from the distances and finally (hi) building the multiple alignment guided by the tree. This work studied different methods for performing each step of progressive alignment and 342 aligners were built combining these methods. The input parameters suitable for most aligners were determined by empirical studies. After the parameters definition for each type of aligner, which where tested against two reference subsets of BAliBASE. The test results showed that the best aligners were those using the profile alignment to generate the multiple alignment, especially those using affine gap penalty function. In addition, this work shows that among the aligners of grouping by consensus, those that use the logarithmic gap penalty function presented better performance / Mestrado / Bioinformatica / Mestre em Ciência da Computação
322

Enumeração de traces e identificação de breakpoints = estudo de aspectos da evolução / Enumeration of traces and breakpoint identification : study of evolutionary aspects

Baudet, Christian 17 August 2018 (has links)
Orientador: Zanoni Dias / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-17T08:10:32Z (GMT). No. of bitstreams: 1 Baudet_Christian_D.pdf: 3490604 bytes, checksum: 7f0a8868574d06e11524e5a5de9d1fd0 (MD5) Previous issue date: 2010 / Resumo: O estudo de rearranjo de genomas tem o objetivo de auxiliar o entendimento da evolução. Através da análise dos eventos de mutação como inversões, transposições, fissões, fusões, entre outros, buscamos compreender as suas influências sobre o fenômeno da diferenciação das espécies. Dentro deste contexto, esta tese ataca dois temas distintos: a Enumeração de Traces e a Identificação de Breakpoints. Os algoritmos de ordenação de permutações por reversões orientadas produzem uma única solução ótima enquanto o conjunto de soluções é imenso. A enumeração de traces de soluções para este problema oferece um modo mais compacto de representar o conjunto completo de soluções ótimas. Dessa maneira, esta técnica fornece aos biólogos a possibilidade de análise de diversos cenários evolutivos. Neste trabalho, realizamos um estudo para melhora da eficiência do algoritmo de enumeração através da adoção de uma estrutura de dados mais simples. Devido ao caráter exponencial do problema, grandes permutações não podem ser processadas em um tempo satisfatório. Assim, com o objetivo de produzir cenários evolucionários alternativos para grandes permutações, propomos e avaliamos estratégias para a enumeração parcial de traces. Os pontos de quebra (ou breakpoints) são regiões que delimitam os segmentos conservados existentes nos cromossomos e denotam a ocorrência de rearranjos evolutivos. As técnicas de identificação de breakpoints têm a função de identificar tais pontos nas sequências dos cromossomos. Nesta tese, implementamos um método de detecção e refinamento de pontos de quebra proposto na literatura e o disponibilizamos como um pacote que pode ser utilizado por outros pesquisadores. Além disso, introduzimos uma nova metodologia de identificação de breakpoints baseada na análise da cobertura de hits observada nos alinhamentos de sequências intergênicas, provenientes dos genomas das espécies comparadas / Abstract: The study of genome rearrangements helps biologists understand the evolution of species. The species differentiation phenomenon are derived by analyzing mutational events (inversions, transpositions, fissions, fusions, etc) and their effects. In this context, this work aims the study of two different subjects: Traces Enumeration and Breakpoint Identification. Algorithms that solve the problem of sorting oriented permutations through reversals output only one optimal solution, although the set of solutions can be huge. The enumeration of traces of solutions for this problem allows a compact representation of the set of all optimal solutions which sort a permutation. By using this technique, biologists can study many evolutionary scenarios. We carried out a study to improve the efficiency of the enumeration algorithm by adopting a simple data structure. Due to the exponential nature of the problem, large permutations cannot be processed at a satisfactory time. Thus, in order to produce alternative evolutionary scenarios for large permutations, we proposed and evaluated strategies for partial enumeration of traces. Breakpoints are regions that border conserved segments in the chromosomes and reflect the occurrence of evolutionary rearrangements. The techniques for breakpoint identification are meant to identify such points in the chromosome sequences. In this work, we implemented a method proposed in the literature, that performs detection and refinement of breakpoints. The implementation is available as a package to other researchers. Additionally, we introduced a new methodology for breakpoint identification based on the analysis of the hit coverage observed in the alignments of intergenic sequences / Doutorado / Ciência da Computação / Doutor em Ciência da Computação
323

Ferramentas de bioinformática para proteômica / Bioinformatics tools for proteomics

Brum, Itaraju Junior Baracuhy 18 August 2018 (has links)
Orientador: Eduardo Galembeck / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-18T00:57:48Z (GMT). No. of bitstreams: 1 Brum_ItarajuJuniorBaracuhy_M.pdf: 1893501 bytes, checksum: 59afb345a47fb8e963452a41b2327f1c (MD5) Previous issue date: 2007 / Resumo: A área de proteômica visa estudar um conjunto completo de proteínas expressas por um organismo ou tecido numa dada situação, através da identificação e quantificação. Apesar de limitações nas técnicas disponíveis, vem se aumentando o volume de informações oriundos desta área, situação que exige o emprego de ferramentas computacionais para permitir o uso eficiente de dados disponíveis, além de buscar-se novas formas de análise destes. Este projeto visa o desenvolvimento de ferramentas de bioinformática para aplicação em proteômica. Estas ferramentas abrangem as seguintes aplicações: Cálculo Teórico de Ponto Isoelétrico e Peso Molecular de seqüências de aminoácidos, eletroforese-bidimensional teórica, digestão teórica e simulação de eletroforese e identificação de peptídeos, ferramenta para análise de Vias Metabólicas a partir de dados de proteômica / Abstract: The proteomics field aims to study sets of proteins expressed in a cell or tissue, according to a specific situation, through protein identification and quantification. Though technical limitations do exist, the amount of information derived from this field increases each day. And so, there is a need for employing computational tools that enable efficient analysis of data. This project aims developing bioinformatics tools for application in proteomics. The tools here presented comprehend the following tasks: theoretical computation of isoeletric point and molecular weight of aminoacid sequences, theoretical two-dimensional electrophoresis, theoretical triptic digestion and electrophoresis simulation for peptide identification, and analysis of metabolic pathways with proteomics data / Mestrado / Bioquimica / Mestre em Biologia Funcional e Molecular
324

Avaliação de transcritos diferencialmente expressos neoplasias humanas com ORESTES / Evaluation of differential expression profiles across neoplasic human samples using ORESTES (Opening reading frame)

Peres, Tarcisio de Souza 30 August 2006 (has links)
Orientador: Fernando Lopes Alberto / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciencias Medicas / Made available in DSpace on 2018-08-07T09:04:32Z (GMT). No. of bitstreams: 1 Peres_TarcisiodeSouza_M.pdf: 2330056 bytes, checksum: 66c1d9241ad60e2d973cfb7361a5eb7c (MD5) Previous issue date: 2006 / Resumo: Durante todo o século XX, a pesquisa do câncer se desenvolveu de maneira sistemática, porém os últimos 25 anos foram notadamente caracterizados por rápidos avanços que geraram uma rica e complexa base de conhecimentos, evidenciando a doença dentro de um conjunto dinâmico de alterações no genoma. Desta forma, o entendimento completo dos fenômenos moleculares envolvidos na fisiopatologia das neoplasias depende do conhecimento dos diversos processos celulares e bioquímicos característicos da célula tumoral e que, porventura, a diferenciem da célula normal (GOLUB e SLONIM, 1999). Nesse trabalho buscamos o melhor entendimento das vias moleculares no processo neoplásico por meio da análise dos dados do Projeto Genoma Humano do Câncer (CAMARGO, 2001) com vistas à identificação de genes diferencialmente expressos nas neoplasias dos seguintes tecidos: mama, cólon, cabeça e pescoço, pulmão, sistema nervoso central, próstata, estômago, testículo e útero. A metodologia de geração dos transcritos utilizada pelo Projeto Genoma Humano do Câncer é conhecida como ORESTES (DIAS et al, 2000). Inicialmente, os dados de seqüenciamento (fragmentos ORESTES) foram agrupados por meio de uma técnica conhecida em Bioinformática como ¿montagem¿, utilizando o pacote de programas de computador PHRED/PHRAP (EWING e GREEN P., 1998). A comparação de cada agrupamento com seqüências conhecidas (depositadas em bases públicas) foi realizada por meio do algoritmo BLAST (ALTSCHUL et al, 1990). Um subconjunto de genes foi selecionado com base em critérios específicos e submetido à avaliação de seus níveis de expressão em diferentes tecidos com base em abordagem de inferência Bayesiana (CHEN et al, 1998), em contraposição às abordagens mais clássicas, como testes de hipótese nula (AUDIC e CLAVERIE, 1997). A inferência Bayesiana foi viabilizada pelo desenvolvimento de uma ferramenta computacional escrita em linguagem PERL (PERES et al, 2005). Com o apoio da literatura, foi criada uma lista de genes relacionados ao fenômeno neoplásico. Esta lista foi confrontada com as informações de expressão gênica, constituindo-se em um dos parâmetros de um sistema de classificação (definido para a seleção dos genes de interesse). Desta forma, parte da base de conhecimento sobre câncer foi utilizada em conjunto com os dados de expressão gênica inferidos a partir dos fragmentos ORESTES. Para contextualização biológica da informação gerada, os genes foram classificados segundo nomenclatura GO (ASHBURNER et al, 2000) e KEGG (OGATA et al, 1999). Parte dos genes apontados como diferencialmente expressos em pelo menos um tecido tumoral, em relação ao seu equivalente normal, integram vias relacionadas ao fenômeno neoplásico (HAHN e WEINBERG, 2002). Dos genes associados a estas vias, 52% deles possuíam fator de expressão diferencial (em módulo) superior a cinco. Finalmente, dez entre os genes classificados foram escolhidos para confirmação experimental dos achados. Os resultados de qPCR em amostras de tecido gástrico normal e neoplásico foram compatíveis com com os dados de expressão gênica inferidos a partir dos fragmentos ORESTES / Abstract: The XXth century showed the development in cancer research in a systematic way, most notably in the last 25 years that were characterized by rapid advances that generated a rich and complex body of knowledge, highlighting the disease within a dynamic group of changes in the genome. The complete understanding of the molecular phenomena involved in the physiopathology of neoplasia is based upon the knowledge of the varied cellular and biochemical processes which are characteristic of the tumor and which make it different from the normal cell (GOLUB e SLONIM, 1999) In this work, we investigated the molecular pathways in the neoplasic process through data analyses of the cDNA sequences generated on the Human Cancer Genome Project (CAMARGO, 2001). The following neoplasias were included: breast, colon, head and neck, lungs, central nervous system, prostate gland, stomach, testicle and womb. The methodology of generation of transcripts used by the Genome Project of Human Cancer is known as ORESTES (DIAS et al, 2000). Initially, the sequence of data (ORESTES fragments) were grouped and assembled according to similarity scores. For this purpose, we used the package of computer programs PHRED/PHRAP (EWING e GREEN P., 1998). The resulting consensus sequences, each representing a cluster, were compared to known sequences (deposited in public databanks) through the BLAST algorithm (ALTSCHUL et al, 1990). A subgroup of genes was selected based on specific criteria and their levels of expression in different tissues were evaluated by a bayesian inference approach (CHEN et al, 1998), as compared to more classical approaches such as null hypothesis tests (AUDIC e CLAVERIE, 1997). The Bayesian inference tool was represented as a PERL script developed for this work. A list of genes, putatively related to the neoplasic phenotype, was created with the support of the literature. This list was compared to the gene expression information, becoming one of the parameters of a ranking system (defined for the selection of genes of interest). Therefore, part of the knowledge related to cancer was used together with the data of gene expression inferred from ORESTES fragments. For a more accurate understanding of the molecular pathways involved in the generated information, the genes were classified according to the Gene Ontology (ASHBURNER et al, 2000) and KEGG (OGATA et al, 1999) nomenclatures. Additional global analyses by pathways related to the neoplasic phenomenon (HAHN e WEINBERG, 2002) demonstrated differential expression of the selected genes. About 52% of the genes in this pathways were differentially expressed in tumor tissue with at least a 5-fold. Finally, ten genes were selected for experimental validation (in vitro) of the findings with real-time quantitative PCR, confirming in silico results / Mestrado / Ciencias Biomedicas / Mestre em Ciências Médicas
325

Reposicionamento in silico de novos fármacos contra o schistosoma mansoni / Repositioning in silico of new drugs against Schistosoma mansoni

Arantes, Morgana Elias 14 March 2016 (has links)
Submitted by Marlene Santos (marlene.bc.ufg@gmail.com) on 2016-08-25T20:20:51Z No. of bitstreams: 2 Dissertação - Morgana Elias Arantes - 2016.pdf: 2372439 bytes, checksum: e242dc3a0095f55eea6f6e8fc5fe0748 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2016-08-26T11:39:26Z (GMT) No. of bitstreams: 2 Dissertação - Morgana Elias Arantes - 2016.pdf: 2372439 bytes, checksum: e242dc3a0095f55eea6f6e8fc5fe0748 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2016-08-26T11:39:26Z (GMT). No. of bitstreams: 2 Dissertação - Morgana Elias Arantes - 2016.pdf: 2372439 bytes, checksum: e242dc3a0095f55eea6f6e8fc5fe0748 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2016-03-14 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Schistosomiasis is a neglected tropical disease caused by parasites of the genus Schistosoma. In Brazil only Schistosoma mansoni transmits this disease. The World Health Organization estimated in 2012 approximately 249 million people at risk of acquiring this disease around the world. The main strategy to control this disease is the treatment of individuals living in endemic areas with Praziquantel. The drug praziquantel is used on a large scale in the treatment of schistosomiasis and currently there are reported cases of resistance, indicating the need to discover new drugs. In silico drug repositioning is a strategy that reduces the time and cost in the search of anti-schistosomal agents. This work used bioinformatics tools and methodology based on previous studies, as a means to identify potential new S. mansoni targets and drug homologs, consequently identifying potential new schistosomal drugs. A list was compiled with S. mansoni potential targets that are part of essential processes in the database TDR and the targets that are part of the tegument were obtained in the scientific literature. The file with S. mansoni targets contained 1376 targets, and of these only 61 targets associated with 399 drugs had homology with drug targets. After removal of duplicate drugs, drugs found in previous studies and after the analysis of the conservation of the active site only 28 S. mansoni targets associated with 102 drugs had 60% or more of the active site conserved. Some of the drugs had activity and are interesting to validate this study such as: artemether, lumefantrine, meloxicam. Among the drugs found 18 drugs were selected to be tested using the following criteria: low toxicity in vivo, expired patent and a value of log P interesting for oral administration. / A esquistossomose é uma doença tropical negligenciada causada por parasitos do gênero Schistosoma. No Brasil apenas o Schistosoma mansoni transmite esta doença. A Organização Mundial de Saúde estimou em 2012 cerca de 249 milhões de pessoas em risco de adquirirem esta doença por meio de diferentes espécies e países. A principal estratégia no controle desta doença é o tratamento dos indivíduos que vivem em áreas endêmicas com o fármaco praziquantel. O praziquantel é o fármaco utilizado em ampla escala no tratamento desta doença e atualmente há casos de resistência relatados, sendo necessário a descoberta de novos fármacos. O reposicionamento in silico é uma estratégia que reduz o tempo e o custo na busca de fármacos esquistossomicidas. Neste trabalho, por meio da ferramenta de bioinformática e com base em estudos anteriores, identificou-se potenciais novos alvos homólogos a alvos de fármacos em uso em humanos, identificando com isso, potenciais novos fármacos esquistossomicidas. Compilou-se uma lista com os potenciais alvos do S. mansoni que fazem parte das vias essências da base de dados do TDR e encontrou-se os alvos que fazem parte do tegumento na literatura científica. O arquivo com os alvos do S. mansoni continha 1376 alvos, sendo que destes apenas 61 alvos do S. mansoni possuía homologia com alvos de fármacos associados a 399 fármacos. Após a remoção dos fármacos duplicados, fármacos encontrados em estudos anteriores e após a análise da conservação do sítio ativo restou 28 alvos do S. mansoni associados a 102 fármacos que tinha 60% ou mais do sítio ativo. Encontrou-se alguns fármacos com atividade comprovada e validam o estudo como: artemeter, lumefantrina, meloxicam. Dentre os fármacos encontrados cerca 18 fármacos foram selecionados para serem testados e a sua atividade então comprovada, utilizando os seguintes critérios: baixa toxicidade in vivo, patente expirada e um valor de log P interessante para um fármaco de administração oral.
326

Identificação de metaloproteínas associadas a cobre, ferro e zinco codificadas pelos genomas de Paracoccidioides spp. / Identification of copper, iron and zinc metalloproteins coded by Paracoccoidioides spp. genomes

Tristão, Gabriel Brum 11 March 2014 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2016-10-10T15:41:50Z No. of bitstreams: 2 Dissertação - Gabriel Brum Tristão - 2014.pdf: 2758860 bytes, checksum: 2422850e561b8d6f9f4cfd50487ebf4c (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2016-10-10T15:42:14Z (GMT) No. of bitstreams: 2 Dissertação - Gabriel Brum Tristão - 2014.pdf: 2758860 bytes, checksum: 2422850e561b8d6f9f4cfd50487ebf4c (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2016-10-10T15:42:14Z (GMT). No. of bitstreams: 2 Dissertação - Gabriel Brum Tristão - 2014.pdf: 2758860 bytes, checksum: 2422850e561b8d6f9f4cfd50487ebf4c (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2014-03-11 / Fundação de Amparo à Pesquisa do Estado de Goiás - FAPEG / Approximately one third of all proteins have been estimated to contain at least one metal cofactor, being named metalloproteins. These represent one of the most diverse classes of proteins, containing metal ions provide catalytic, regulatory and structural functions. Bioinformatic tools have been developed to predict metalloproteins encoded by an organism based only on its genome sequence. Paracoccidioides complex includes termodimorphic pathogenic fungi that are found as saprobiotic mycelia in the environment and as yeast in host tissues. They are the etiologic agents of Paracoccidioidomycosis, a prevalent systemic mycosis in Latin America. It is known that many metalloproteins are important for virulence of several pathogenic microorganisms. On this way, the present work aimed to predict the cooper, iron and zinc proteins encoded by the genomes of three phylogenetic species of Paracoccidioides spp. (Pb01, Pb03 and Pb18). Cu-, Fe- and Zn-proteins represents 7% of the total proteins encoded by Paracoccidioides spp genomes. Zinc-proteins were the most abundant metalloproteins representing 5.7% of the fungus proteome, while copper and iron proteins represent 0.3% and 1.2% respectively. Functional classification revealed that metalloproteins are related to many cellular processes. Furthermore it was observed that many of these metalloproteins play roles as virulence factors, in the biology of the fungus, and an analysis of the protein interactions revealed that many of them depend on each other to perform their functions. Thus, it is concluded that the Cu-, Feand Zn- metalloproteome of Paracoccidioides is of utmost importance for biology and virulence / É estimado que por volta de um terço de todas as proteínas já conhecidas contém pelo menos um cofator metálico, sendo chamadas de metaloproteínas. Estas representam uma das mais diversas classes de proteínas, contendo íons metálicos que fornecem função catalítica, regulatória e estrutural. Atualmente ferramentas bioinformáticas tem sido desenvolvidas no intuito de prever metaloproteinas codificadas por um dado organismo tendo como base apenas a sua sequência genômica. O complexo Paracoccidioides inclui fungos termodimórficos, patogênicos que são encontrados como micélio saprobiótico no meio ambiente e como levedura nos tecidos de indivíduos infectados. Estes fungos são os agentes etiológicos da Paracoccidioidomicose (PCM), uma micose sistêmica prevalente na América Latina. Sabe-se que muitas metaloproteínas são importantes para a virulência de vários microorganismos patogênicos. Desta forma, o presente trabalho teve como objetivo prever as cobre, ferro e zinco proteínas codificadas pelos genomas de três espécies filogenéticas de Paracoccidioides spp. (Pb01, Pb03 e Pb18). As Cu, Fe e Zn- proteínas representam 7% do total de metaloproteínas codificadas pelos genomas de Paracoccidioides spp. As zinco proteínas foram as mais abundantes, representando 5,7% do metaloproteoma dos fungos, enquanto que as proteínas de cobre e ferro representam 0,3% e 1,2% respectivamente. A classificação funcional revelou que essas metaloproteínas estão relacionadas com muitos processos celulares. Além disso, observou-se que muitas destas metaloproteínas atuam como fatores de virulência na biologia do fungo, e uma análise da interação destas metaloproteínas revelou que muitas dependem uma da outra para exercer suas funções. Assim, conclui-se que o metaloproteoma de Cu, Fe e Zn de Paracoccidioides spp. é de extrema importância para a biologia e virulência deste patógeno humano.
327

Caracterização da região Bru1 no genoma da cultivar RB867515 (Saccharum spp.) utilizando sequenciamento de nova geração / Characterization of Bru1 region of sugarcane cultivar RB867515 using next generation sequencing

Souza, Isabela Pavanelli de 25 September 2014 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2017-04-18T14:12:04Z No. of bitstreams: 2 Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-04-18T14:13:10Z (GMT) No. of bitstreams: 2 Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-04-18T14:13:10Z (GMT). No. of bitstreams: 2 Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2014-09-25 / Financiadora de Estudos e Projetos- Finep / Outro / Sugarcane is known as one of the most important crops of the word for its sub products utilization. Four countries, led by Brazil, supply the sugar international trade. Ethanol is other important sugarcane sub product, recognized as an alternative product to sugar, and had great demand in Brazilian trade, for its utilization as non-fossil fuel. The sugarcane genome is one of the most complex among crops, with 10 Gb. Its complete genome is not available, but the recent innovations in genomics tools open up new possibilities for the investigations about the sugarcane’s genome. We did a genome assembly and annotation of a Brazilian sugarcane cultivar (RB867515) genome region, correspondent to eight R570 homologous sequences already published. We use high qualities paired-ends libraries produced by Illumina HiSeq 2000 sequencing platform. The reads were aligned against eight R570 BACs (Bacterial Artificial Chromosome) sequences stored in NCBI using Bowtie2. We used MaSuRCA to assemble the aligned reads de novo, and the consensus sequences were obtained with SAMtools mpileup option. The transposable elements were identified using RepeatMasker and the gene regions were annotated with Blastx against the GenBank non-redundant protein database. After that, the consensus sequences were aligned with the matching reference (R570) using ClustalW in Mega software, to look for the percentage of mismatches and conserved sites between them. We obtained the number of scaffolds bigger than 1 kb ranging from 607 to 2,884, and the longest scaffold had near 21 kb. The consensus sequence length ranged from 81 to 142 kb, and the recovery rate relative to the reference ranged from 82% to 97%. The sequences amounted 1 Mb of RB867515 cultivar genome. We identified 5,145 repeated elements, which 4,662 were microsatellite and 460 were transposable elements, amounted 225 kb of repeated sequences. Among the mobile elements, the retrotransposons comprises 15% of nucleotide composition, ranging from 8% to 29% among BACs. The 134 genes identified on the eight BAC consensus sequences comprised a total of 243 kb, resulting in a density of one gene per 7.2 kb. The average number of genes per BAC was 16, with an average gene length of 1,841 bp. The percentage of mismatches between the RB867515 and R570 BACs ranged from 0.27% to 1.32%. The sugarcane BACs correspond to homeologous genomic regions, with this alignment we can suggest high divergence inside an homeologous group. / A cana-de-açúcar é reconhecida como uma das mais importante culturas do mundo, pela utilização dos seus subprodutos. O genoma da cana-de-açúcar é um dos mais complexos entre as plantas cultivadas, com aproximadamente 10 Gb. Seu genoma completo ainda não foi sequenciado, mas o surgimento e a popularização de novas ferramentas de análise genômica possibilitaram estudos refinados sobre essa cultura. Com o grande volume de informações que é possível gerar, a demanda atual é a produção ferramentas eficientes para o processamento dos dados. Foi realizado um assembly e anotação de uma região do genoma da cultivar RB867515 correspondente às sequências de 8 BACs da cultivar R570. As regiões correspondentes foram obtidas por alinhamento usando Bowtie2 com reads de bibliotecas paired-ends produzidos por sequenciador automático de nova geração e montados de novo utilizando MaSuRCA. Os scaffolds foram alinhados às sequência de referência usando BWA-SW, e as sequências consenso foram obtidas pela opção mplieup do SAMtools. Reads de cDNA de cinco tecidos vegetais, provenientes de 30 genótipos de cana-de-açúcar obtidos pela estratégia RNA-seq, foram mapeados nas sequências consenso a fim de identificar as regiões gênicas, que foram anotadas utilizando Blastx contra o banco de proteínas não redundante no GenBank. As regiões repetitivas foram determinadas pelo RepeatMasker e os microssatélites pelo IMEX. Para a comparação entre as sequências das duas cultivares, foi realizado uma alinhamento das sequências correspondentes nos dois genomas utilizando ClustalW no software Mega. O assembly das oito regiões, gerou de 607 à 2884 scaffolds maiores que 1 kb, com o maior scaffold chegando a 21 kb. As sequências consenso variam de 81 a 142 kb de tamanho, representando uma taxa de recuperação em relação à referência de 82% a 97%. O tamanho total das sequências montadas somou quase 1 Mb do genoma da cultivar de cana-deaçúcar. Em relação à anotação, foram identificados 5145 elementos genéticos repetitivos, em que 4662 são microssatélites e 460 são transposons, totalizando 225 kb em sequências repetidas ao longo dos BACs. Dentro do grupo dos elementos genéticos móveis os retrotransposons são maioria, com 15% da composição nucleotídica, variando de 8% a 29% entre os BACs. Foram identificados 134 genes nas oito sequências de cana-de-açúcar analisadas, totalizando 243 kb. O número de genes por BAC variou de 11 a 26, com uma média de 16 genes por BAC. Os genes encontrados apresentaram tamanho médio de 1841 pb, variando de 443 (BAC1) à 6316 pb (BAC3). A densidade de genes média foi de 1 gene por 7,2 kb. A porcentagem de mismatches entres as sequências dos BACs de RB867515 variou de 0,27% a 1,32%. Os BACs de cana-deaçúcar correspondem a regiões genômicas homeólogas, com o alinhamento realizado com as duas cultivares pode-se sugerir que existe alta divergência dentro do grupo de homeologia.
328

Modelagem molecular das proteínas captadoras de molibdato (ModA) e oligopeptídeos (OppA) de Xanthomonas axonopodis pv. citri . / Molecular modeling of molibdate (ModA) and oligopeptide (OppA) uptake proteins in Xanthomonas axonopodis pv. citri.

Alexandre Moutran 24 April 2009 (has links)
Sistemas de transporte tipo ABC são responsáveis pelo transporte de uma grande variedade de substâncias dentre elas os oligopeptídeos e molibdato. Neste trabalho estudamos dois sistemas de transportadores do tipo ABC (mod, envolvido na captação de molibdato e o opp na capação de oligopeptídeos) presentes na bactéria Xanthomonas axonopodis pv. citri (Xac). Em particular analisamos a organização genética dos óperons mod e as proteínas ModA e OppA, componentes solúveis localizados no periplasma e responsáveis pela ligação aos substratos. Por meio de técnicas de modelagem molecular, definimos modelos estruturais para as proteínas ModA e OppA. Para a proteína ModA caracterizamos cinco resíduos que compõem a cavidade ligadora e são responsáveis pelas interações com o íon molibdato, assim como a sua similaridade estrutural e sequencial com ortólogos de 3 grupos distintos de bactérias. Para a OppA, descrevemos o seu comportamento na ancoragem de diferentes oligopeptídeos. Avaliamos parâmetros como a extensão da cadeia e estabelecemos uma ordem crescente de afinidade entre os oligopeptídeos com diferente composição residual e a proteína OppA. / ABC transport system are responsable for the uptake of a large variety of substrates, including oligopeptides and molybdate. In this work we studied two ABC transporter systems (mod and opp responsable for molybdate and oligopeptide uptake, respectively) present in plant pathogen Xanthomonas axonopodis pv. citri (Xac). We investigated the genetic organization of mod operon and, particularly, structural feature of periplasmic components, ModA and OppA proteins, of the uptake systems. Using molecular modeling techniques, we defined the structural models of both ModA and OppA proteins. Based on the ModA structural model, amino acid residues involved in molybdate interaction were identified. In addition, both the structural and sequence similarities of Xac ModA and other bacterial orthologs with experimentally defined structural organizations were described. Based on the OppA structural model, we applied molecular docking tools to determine the binding specificity for different oligopeptide regarding number and amino acid composition. Collectively, our results represent an important contribution to the study of ABC transporters in an economically relevant phytopathogen bacterial species.
329

Montagem de novo do transcriptoma de teca (Tectona grandis L. f.) e busca por genes relacionados ao estresse hídrico / De novo assembly of teak (Tectona grandis L. f.) transcriptome and search for water-stress related genes

Tarcisio Sales Vasconcelos 22 May 2015 (has links)
A teca é uma árvore de grande importância comercial pelas características de cor e durabilidade de sua madeira. Devido a sua rusticidade e fácil adaptação ao clima, plantios de teca tornam-se cada vez mais atrativos ao redor do mundo. Contudo, esta espécie apresenta escassez de estudos genéticos moleculares a respeito tanto de sua madeira, quanto de sua tolerância às variações ambientais. Uma vez que o transcriptoma pode apresentar grande quantidade de informação a respeito dos genes expressos por um conjunto celular, neste trabalho foi realizado o primeiro transcriptoma de teca, onde foram sequenciadas flores, folhas, raízes e seedlings pela tecnologia Illumina. A montagem do transcriptoma foi realizada com o programa Trinity acima de 100 milhões de reads e gerou mais de 400 mil contigs, os quais tiveram as anotações funcionais adquiridas com o programa Blas2GO. 51% dos contigs foram anotados, mostrando alta similaridade com as espécies Vitis vinifera e Solanum licopersicum; destes, 78% obtiveram anotações funcionais com o Gene Ontology, totalizando 5.165 termos para Processo Biológico, 2.846 termos para Função Molecular e 742 para Componente Celular. A expressão diferencial foi obtida com o programa edgeR a 5% de probabilidade de erro e mostrou que, para 187.315 contigs montados através da fusão de todas as bibliotecas sequenciadas, 18 mostraram expressão diferencial para flor, 14 para folha, 13 para raiz e 29 para seedling. Após a etapa de caracterização do transcriptoma, foi realizado um experimento de estresse por déficit hídrico em casa-de-vegetação, onde plantas de teca foram submetidas a estresse Moderado (40% de água no substrato por 20 dias), estresse Severo (20 a 40% de água por 30 dias) e tratamento controle (substrato saturado). As medições através de analisador de gases por infravermelho (IRGA) mostraram queda na fotossíntese (até 70% a menos do que o controle), na transpiração (até 77%) e na condutância estomática (até 85%) entre os tratamentos; além disto, o conteúdo relativo de água foliar caiu 13% entre o tratamento severo e o controle, e níveis de prolina livre foram até 3,5 vezes mais altos nos tratamentos de estresse. A temperatura foliar aumentou significativamente com o aumento da irradiância de fótons aplicada. A busca por genes relacionados ao estresse por déficit hídrico na biblioteca de transcritos de Raiz retornou 1.145 sequências, e destas, 4 foram caracterizadas: TgTPS (trealose 6-fosfato sintase), TgPIP (aquaporina, proteína intrínseca de membrana plasmática), TgDREB2 (proteína de ligação a elemento responsivo a desidratação) e TgAREB (proteína de ligação a elemento responsivo a ácido abscísico). Apenas TgTPS, TgPIP e TgDREB2 mostraram alto grau de conservação entre as espécies, podendo ser corretamente amplificadas via PCR e validadas por sequenciamento. Assim, com o banco de dados de transcritos obtido pelo RNA-seq, foi possível identificar genes candidatos ao estudo de características vegetativas e reprodutivas de teca, contribuindo para entender os mecanismos moleculares desta espécie florestal. / Teak is a tree of great commercial importance by the characteristics of color and durability of its wood. Due to its hardiness and easy adaptation to climate, teak plantations become increasingly attractive around the world. However, this species has a lack of molecular genetic studies on both of its wood, as their tolerance to environmental variations. Once the transcriptome can provide lots of information about the genes expressed by a cell group, this work represents the first transcriptome teak, which were sequenced flowers, leaves, roots and seedlings by Illumina technology. The transcriptome assembly was performed with Trinity program above 100 million reads and generated more than 400,000 contigs, which have acquired the functional annotations with Blas2GO program. 51% of the contigs were annotaded, showing high similarity to Vitis vinifera and Solanum licopersicum; of these, 78% had functional annotations with the Gene Ontology, totaling 5,165 terms for Biological Process, 2846 terms for Molecular Function and 742 for Cell Component. The differential expression was obtained with the edgeR program at 5% probability of error and showed that for 187,315 contigs assembled by merging all sequenced libraries, 18 showed differential expression to flower, 14 to leaf, 13 to root and 29 for seedling. After this step of characterization of the transcriptome, we performed a stress experiment by water deficit at greenhouse, where teak plants were subjected to Moderate stress (40% of water in the substrate for 20 days), Severe stress (20 to 40% water for 30 days) and control treatment (saturated substrate). Measurements by infrared gas analyzer (IRGA) showed a decrease in photosynthesis (up to 70% less than the control), transpiration (up 77%) and stomatal conductance (up 85%) between treatments; furthermore, leaf relative water content dropped 13% between the treatment control and severe, and free proline levels were up to 3.5 fold greater in stress treatments. The leaf temperature increased significantly with increasing irradiance of photons applied. The search for genes related to stress by water deficit in the root transcripts library returned 1,145 sequences, and these, 4 were characterized: TgTPS (trehalose 6-phosphate synthase), TgPIP (aquaporin, protein intrinsic of plasma membrane), TgDREB2 (dehydration responsive element binding protein) and TgAREB (abscisic acid responsive element binding protein). Only TgTPS, TgPIP and TgDREB2 showed a high degree of conservation between species, and can be properly amplified by PCR and validated by sequencing. Thus, with the database of transcripts obtained by RNA-seq, candidate genes were identified for the study of vegetative and reproductive characteristics teak, helping to understand the molecular mechanisms of this forest species.
330

Análise e anotação do genoma de Epicoccum nigrum e metabolismo secundário. / Analysis and annotation of Epicoccum nigrum genome and secondary metabolism.

Almir José Ferreira 06 July 2016 (has links)
O fungo endofítico Epicoccum nigrum atua no biocontrole de fitopatógenos e produz uma série de compostos com de interesse biotecnológico como antimicrobianos. Neste trabalho, foi utilizado um conjunto de sequências genômicas previamente montadas. As sequências foram anotadas para compreensão funcional utilizando a plataforma EGene2 incluindo alguns componentes específicos desenvolvido neste trabalho. Foram estimados 10.320 genes codificadores de proteínas, além de tRNAs, rRNAs e ncRNAs. As proteínas preditas foram comparadas aos proteomas de outros fungos e comparadas filogeneticamente. Além disso, foi desenvolvido Synteny Clusters, um programa que compara clusters de genes de metabólitos secundários aos de outros fungos. E. nigrum apresenta grande similaridade com outros fungos com estilo de vida distinto. Foram identificados três clusters de genes relacionados a doenças que estão presentes em fitopatógenos e ausentes em E. nigrum. Os resultados sugerem que as diferenças entre endófitos e fitopatógenos pode estar relacionada a um pequeno número de genes. / The endophytic fungus Epicoccum nigrum has been used for plant pathogen biocontrol in different host plants, since it produces a series of secondary metabolites of biotechnological interest, including antimicrobials. In this regard, we used assembled 454 sequencing dataset was used to perform a comprehensive functional annotation using the EGene2 platform, including some specific components developed in this work. We found 10,320 protein coding genes as well as tRNAs, rRNAs and ncRNAs. The predicted proteins were compared to proteomes of other fungi and used in phylogenetic analyses. In addition, we developed Synteny Clusters, a program that compares gene clusters with others fungi. E. nigrum presents a genome very similar to others fungi with distinct lifestyles. Finally, we identified three disease-related gene clusters that are absent in E. nigrum and present in most plant pathogenic fungi. This result suggests that the lifestyle differences observed between endophytic and pathogenic fungi may rely on a relatively low number of genes.

Page generated in 0.1109 seconds