• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 59
  • Tagged with
  • 59
  • 59
  • 38
  • 26
  • 18
  • 14
  • 13
  • 12
  • 12
  • 8
  • 8
  • 8
  • 8
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Reconstrução filogenética de procariotos com base em famílias de genes homólogos / Phylogenetic reconstruction of prokaryotes based on homologous gene families

Pereira, Vivian Mayumi Yamassaki 03 April 2017 (has links)
A comparação de genomas é uma importante tarefa na qual a bioinformática pode ser aplicada, uma vez que ela permite a identificação de genes patogênicos, o que, por sua vez, pode auxiliar a combater ou a prevenir o surgimento de doenças. A partir da comparação de genomas, também é possível realizar a análise filogenética, que permite entender as relações evolutivas entre diferentes organismos. Em genomas de bactérias, essa análise geralmente é realizada com base no gene 16S rRNA. Entretanto, apesar de ser amplamente utilizado, filogenias com base nesse gene podem ter dificuldades para diferenciar organismos muito próximos evolutivamente. Essa importância da comparação de genomas e a necessidade de uma metodologia que permita distinguir organismos evolutivamente próximos na análise filogenética motivaram este trabalho, que teve como objetivo implementar ferramentas computacionais para identificar genes homólogos em genomas e, com base nesses genes, gerar filogenias e analisar se é possível distinguir os organismos evolutivamente próximos nessas filogenias. Para tanto, as ferramentas desenvolvidas para identificação de genes homólogos recebem resultados de alinhamentos e os filtram, de modo que dois genes são considerados homólogos se o alinhamento entre eles satisfizer os limiares definidos. Após a identificação das famílias de genes homólogos, tabelas são geradas com informações a respeito dos genes homólogos em cada genoma e, com base nessas tabelas, é possível gerar matrizes de distância e utilizar métodos de agrupamento hierárquico para a geração da filogenia ou realizar alinhamentos múltiplos com os genes identificados para posterior reconstrução filogenética. Além disso, também é possível representar os genes e famílias de genes homólogos por meio de um grafo, que pode auxiliar na escolha dos limiares para filtrar os alinhamentos. Para demonstrar e analisar a aplicabilidade das ferramentas desenvolvidas e das abordagens adotadas, experimentos foram realizados utilizando genomas de bactérias do gênero Xanthomonas, que contém um grande grupo de bactérias que causam doenças em plantas. Os resultados obtidos foram então comparados com filogenias de referência e com resultados de outros experimentos realizados. Essas comparações demonstraram que as famílias de genes homólogos podem ser úteis para distinguir genomas de organismos muito próximos evolutivamente, apesar de que essa abordagem apresentou dificuldades para separar os grupos de genomas mais distantes. Em contrapartida, na filogenia gerada a partir da região 16S rRNA, foi possível diferenciar esses organismos mais distantes, mas não foi possível distinguir os organismos muito próximos. Por fim, os experimentos realizados fornecem indícios de que as ferramentas desenvolvidas e as abordagens adotadas podem ser úteis para diferenciar genomas muito próximos evolutivamente de outros procariotos além das bactérias estudadas neste trabalho / Genome comparison is an important task on which bioinformatics can be used because it allows the identification of pathogen genes which can aid the combat of diseases and to avoid the emerging of new ones. Genome comparison also allows the phylogenetic analysis which provides the understanding of evolutional relations of different organisms. In bacterial genomes, this analysis is commonly based on 16S rRNA gene. Unfortunately, it can present some difficulties to distinguish closely related organisms. This importance of genome comparison and the necessity of a methodology to distinguish organisms that are closely related motivated this study, which aimed the development of computational tools to identify homologous genes in genomes, to use these genes to reconstruct phylogenies and to analyze if it is possible to distinguish closely related organisms on these phylogenies. To achieve this purpose, the developed tools to identify homologous genes receive the alignments results and filter it, such that two genes are homologous if their alignment satisfies the thresholds. After the identification of homologous gene families, the tools generates tables with information about the homologous genes presents in each genome and with these tables it is possible to create distance matrix to be used by hierarchical clustering methods to generate phylogenies or it is possible to perform multiple alignments with the identified genes to accomplish a phylogenetic reconstruction. Besides that, it is possible to represent the genes and homologous gene families in a graph, which can aid the choice of the thresholds to filter the alignments. To demonstrate and analyze the applicability of the developed tools and the approaches chosen in this study, experiments were performed using genomes of the bacterial genus Xanthomonas, which include a group of phytopathogenic bacteria. The results obtained were compared with reference phylogenies and with results of other experiments. These comparisons showed that homologous gene families can be used to differentiate closely related organisms, despite the fact that it presented difficulties to distinguish the groups of genomes that were evolutionarily far from each other. On the other hand, the phylogeny based on 16S rRNA region allows to distinguish the groups of genomes that were distant, but it was not possible to differentiate closely related organisms. As a conclusion, the experiments performed give pieces of evidence that the developed tools and the approaches adopted can be useful to distinguish genomes of closely related organisms of other prokaryotes besides the bacterias considered in this study
12

Hibridação Genômica Comparativa em Endometriose / Comparative Genomic Hybridization in Endometriosis

Castelli, Luciana Caricati Veiga 31 March 2008 (has links)
A endometriose é uma doença ginecológica benigna comum, mas agressiva, caracterizada pela presença de tecido endometrial ectópico. A teoria mais aceita para explicá-la é a teoria de Sampson, na qual o tecido endometrial descamado durante a menstruação sofre refluxo através das tubas uterinas, adere e se prolifera em sítios ectópicos da cavidade peritoneal. Por outro lado, apenas o refluxo tubário não é capaz de estabelecer a doença e vários estudos sugerem uma etiologia multidimensional incluindo fatores hereditários, hormonais e imunológicos. Várias metodologias têm sido propostas com o objetivo de identificar genes candidatos para a endometriose. A hibridação genômica comparativa (CGH) é uma técnica que permite que o genoma inteiro seja analisado em um só experimento, sem a necessidade de cromossomos metafásicos obtidos por cultura celular. Nossa proposta foi avaliar, por CGH, amostras de endometriomas ovarianos e de tecido endometrial eutópico de dez pacientes com diagnóstico firmado de endometriose, para screening do genoma. No grupo eutópico, 6/10 amostras apresentaram alterações caracterizadas por perdas ou ganhos de regiões cromossômicas e no grupo ectópico foram encontradas alterações em 7/10 casos. A presença de perdas e ganhos de regiões cromossômicas no endométrio eutópico, histologicamente normal, de mulheres com endometriose ovariana, pode ser considerada como alteração primária ao desenvolvimento da doença. A metodologia de CGH permitiu a detecção das regiões cromossômicas 11q12.3-q13.1, 17p11.1-p12 e 17q25.3-qter como regiões críticas, direcionando investigações futuras para identificação de genes associados à endometriose. / Endometriosis is a common benign gynecological disease, very aggressive, characterized by the presence of ectopic endometrial tissue. The most accepted theory to explain it is Sampson\'s implantation theory, which says that the endometrial tissue exfoliated during menstruation undergoes reflux through the uterine tubes, adheres and proliferates in ectopic sites of the peritoneal cavity. On the other hand, only reflux is not enough to the establishment of the disease and a number of studies suggest a multidimensional etiology including hereditary, hormonal and immunological factors. Several methodologies have been proposed for the identification of candidate genes for endometriosis. The comparative genomic hybridization (CGH) is a versatile technique that allows the entire genome to be analyzed in only one experiment without the necessity of metaphasic chromosomes from the sample, excluding the cell culture. We aimed to evaluate, by CGH, ovarian endometriomas and eutopic endometrial tissue samples from 10 patients with confirmed diagnosis of endometriosis, for a genomic screening. In the eutopic group, 6/10 samples presented genomic imbalances and 7/10 cases showed alterations in the ectopic group. The presence of losses and gains of chromosomic regions in the histologically normal eutopic endometrium from women with ovarian endometriosis can be considered as a primary alteration in the development of the disease. The CGH methodology allowed the detection of chromosomic regions 11q12.3-q13.1, 17p11.1-p12 and 17q25.3-qter as critical regions, leading to future investigations for the identification of genes associated to endometriosis.
13

Análise genômica e funcional da Nodularia spumigena CENA596 formadora de florações em tanques de produção de camarões / Genomic and functional analysis of the bloom-forming Nodularia spumigena CENA596 in shrimp production ponds

Popin, Rafael Vicentini 12 September 2017 (has links)
Nodularia spumigena é uma espécie cianobacteriana conhecida como produtora da hepatotoxina nodularina. Essa cianotoxina é uma potente e irreversível inibidora de proteínas fosfatases da família serina/treonina (PP1 e PP2A) de células eucarióticas e é uma promotora tumoral e suspeita carcinogéna. Além da nodularina, a N. spumigena também é produtora de outros peptídeos não ribossômicos, tais como espumiginas, aeruginosinas e anabaenopeptinas. O primeiro relato de N. spumigena formadora de florações no Brasil ocorreu em 2011 em tanques de produção de camarões no Rio Grande, RS, e estimulou o interesse na obtenção de informações sobre o seu genoma e potencial biossíntético. Dessa forma, a objetivo deste estudo foi avaliar os aspectos genômicos e funcionais da linhagem Nodularia spumigena CENA596 isolada de um tanque de produção de camarões de Rio Grande. Para isso, uma cultura da linhagem N. spumigena CENA596 foi submetida a um tratamento com hipoclorito de sódio (2%) para eliminação de contaminantes e o DNA extraído das células tratadas foi sequenciado na plataforma MiSeq e analisado com ferramentas genômicas. O sequenciamento e a montagem do seu genoma originaram 291 sequências contíguas com percentual GC de 41,19 e tamanho total de 5.189.679 pb. A análise filogenética baseada na sequência do gene que codifica o 16S rRNA agrupou a linhagem CENA596 com outras de N. spumigena da Austrália e América do Norte. Na árvore filogenômica construída com as sequências concatenadas de 31 proteínas, a linhagem brasileira CENA596 agrupou-se com valor de reamostragem de 100% com a N. spumigena CCY9414 originária do mar Báltico. As análises comparativas entre os genomas dessas duas linhagens indicaram um grande número de genes compartilhados, os quais estão relacionados principalmente ao metabolismo primário das células. Por outro lado, foram encontrados genes específicos para cada uma delas que estão envolvidos em respostas celulares a estresses oxidativos, patógenos e antibióticos. A mineração do genoma da N. spumigena CENA596 revelou 13 agrupamentos gênicos hipoteticamente relacionados à síntese de metabólitos secundários, a maioria dos quais mostrou similaridade significativa com agrupamentos conhecidos. As análises químicas confirmaram a produção de duas variantes de nodularina, espumigina, namalida, aeruginosina e aminoácidos tipo micosporina, e uma variante de geosmina. A linhagem brasileira N. spumigena CENA596 mostrou-se capaz de produzir uma variedade significante de moléculas bioativas e seu genoma revelou-se ser consideravelmente conservado em relação ao genoma da linhagem CCY9414, a qual é conhecida por causar grandes florações tóxicas no Mar Báltico / Nodularia spumigena is a cyanobacterial species known as a producer of the hepatotoxin nodularin. This cyanotoxin is a potent and irreversible inhibitor of eukaryotic cell serine/threonine protein phosphatases (PP1 and PP2A) and is a tumor promoter and suspected carcinogen. In addition to nodularin, N. spumigena is also produces other non-ribosomal peptides, such as spumigins, aeruginosines and anabaenopeptins. The first report of bloom-forming N. spumigena in Brazil occurred in 2011 in shrimp production ponds, Rio Grande, RS, and stimulated interest in obtaining information on its genome and biosynthetic potential. Thus, the objective of this study was to evaluate the genomic and functional aspects of the strain N. spumigena CENA596 isolated from a shrimp production pond of the Rio Grande. For this, a culture of the strain N. spumigena CENA596 was submitted to a treatment with sodium hypochlorite (2%) to eliminate contaminants and the DNA extracted from treated cells was sequenced in a platform MiSeq and analyzed with genomic tools. Genome sequencing and assembly resulted in 291 contiguous sequences with GC percentage of 41.19 and total size of 5,187,679 bp. Phylogenetic analysis based on the gene sequence encoding the 16S rRNA grouped the strain CENA596 with other N. spumigena from Australia and North America. In the phylogenomic tree constructed with the concatenated sequences of 31 proteins, the Brazilian strain CENA596 grouped with a bootstrap value of 100% with the N. spumigena CCY9414 originating from the Baltic sea. Comparative analyses between the genomes of these two strains indicated a large number of shared genes, which are mainly related to the primary metabolism of the cells. Otherwise, genes specific for each of the two strains were identified as involved in cellular responses to oxidative stress, pathogens and antibiotics. Genome mining revealed 13 gene clusters hypothetically related to the synthesis of secondary metabolites, most of which showed significant similarity to known clusters. Chemical analyses confirmed the production of two variants of nodularin, spumigin, namalide, aeruginosin and mycosporine-like amino acid, and one variant of geosmin. The Brazilian strain N. spumigena CENA596 was able to produce a significant variety of bioactive molecules and its genome revealed to be considerably conserved in relation to the genome of the strain CCY9414, which is known to cause large toxic blooms in the Baltic Sea
14

Genômica comparativa de Microcystis aeruginosa (Cyanobacteria: Chroococcales), com ênfase em genes envolvidos com síntese de produtos naturais / Comparative genomics of Microcystis aeruginosa (Cyanobacteria: Chroococales), with emphasis on genes related to natural product synthesis

Weiss, Bruno 04 April 2017 (has links)
A ampla diversidade metabólica das cianobactérias é associada não somente a sua importância nos ciclos biogeoquímicos, mas também a sua distribuição global. Tal característica também é responsável pela capacidade destes organismos em produzir uma ampla variedade de substâncias de estruturas incomuns e atividades de interesse para o homem. Microcystis é um gênero cianobacteriano reconhecido como produtor de mais de duas centenas de produtos naturais, incluindo cianotoxinas. Microcystis aeruginosa é uma espécie frequentemente encontrada em florações, portanto causando preocupações sobre sua influência ecológica, especialmente em corpos d\'água doce utilizados para consumo humano. Desta forma, o objetivo deste trabalho foi o levantamento da diversidade e quantidade de metabólitos secundários que podem ser produzidos pela espécie, através de análises genômicas, além de variáveis que podem potencialmente interferir nas análises computacionais, procurando-se por padrões na espécie, e comparando-se 18 linhagens de todos os continentes. Foi encontrado o total de 235 agrupamentos relacionados ao metabolismo secundário, categorizados em 12 classes segundo as estruturas de seus produtos, nas 18 linhagens, evidenciando a riqueza de agrupamentos relacionados ao metabolismo secundário encontrados nesta espécie. Destes agrupamentos, os mais abundantes pertencem às categorias dos Terpenos, Híbridos, Bacteriocinas e NRPS. Entre as NRPS, nenhuma foi comum a todas as linhagens. Ainda, a quantidade de agrupamentos variou entre 6 e 21, e a quantidade de categorias de produtos variou entre 4 e 10, mostrando uma distribuição heterogênea de agrupamentos e tipos de metabólitos preditos. Esta distribuição heterogênea foi detalhada para melhor compreensão deste padrão encontrado na espécie. Dos agrupamentos de NRPS, os três mais frequentes foram selecionados para uma análise pormenorizada de sua estrutura e sequência: aeruginosina (15 linhagens), microcistina (11 linhagens), e micropeptina (15 linhagens). O agrupamento de micropeptina encontrado nas linhagens SPC777, TAIHU98 e PCC 9806 se mostrou amplamente dissimilar com relação à referência utilizada, potencialmente indicando um erro de identificação causado pela plataforma antiSMASH utilizada para a localização dos agrupamentos. Análises de colinearidade genômica mostram uma baixíssima sintenia entre os genomas das linhagens em análise, sugerindo frequentes eventos de reorganização genômica. Ainda, análises de pangenoma mostram um cenário em que mais genomas desta espécie são necessários para a estimativa da quantidade total de genes diferentes que a espécie pode possuir, o que é interessante para futuros estudos de procura de metabólitos secundários. Análises do genoma cerne apontam para uma estimativa segura de 1.944 genes comuns a todos os genomas desta espécie, o que corresponde entre 35% e 50% dos genes em cada linhagem. Análises estatísticas apontam para diferentes graus de interferência não linear da quantidade de sequências contíguas na observação de diferentes padrões de outras características genômicas, sugerindo precaução nas expectativas com relação ao metabolismo secundário em caso de linhagens em que a montagem gênica ultrapasse o limite superior aproximado de 100 sequências contíguas. / The wide metabolic diversity of cyanobacteria is associated not only with their importance in biogeochemical cycles, but also with their global distribution. Such a feature is also responsible for the ability of these organisms to produce a wide variety of substances with unusual structures and activities of interest to man. Microcystis is a cyanobacterial genus recognized as a producer of more than two hundred natural products, including cyanotoxins. Microcystis aeruginosa is a species frequently found in cyanobacterial blooms, thus causing concerns about its ecological influence, especially in freshwater bodies used for human consumption. In this way, the objective of this work was the survey of the diversity and quantity of secondary metabolites that can be produced by the species, through genomic analyzes, besides variables that can potentially interfere in the computational analyzes, searching for patterns in the species, and comparing 18 strains from all the continents. A total of 235 clusters, categorized in 12 classes according to the structure of their products, were found in the 18 strains, evidencing the richness of clusters related to the secondary metabolism found in this species. Of these clusters, the most abundant belong to the categories of Terpenes, Hybrids, Bacteriocins and NRPS. Among NRPS, none were common to all strains. Also, the number of groups ranged from 6 to 21, and the number of product categories ranged from 4 to 10, showing a heterogeneous distribution of predicted groupings and types of metabolites. Such a heterogeneous distribution was detailed for a better understanding of this pattern found in the species. Of the NRPS clusters, the three most frequent were selected for a detailed analysis of their structure and sequence: aeruginosin (15 strains), microcystin (11 strains), and micropeptin (15 strains). The micropeptide cluster found in the SPC777, TAIHU98 and PCC 9806 strains was widely dissimilar to the reference, só potentially indicating an identification error caused by the antiSMASH platform used to locate the clusters. Genomic collinearity analyzes showed a very low synteny among the genomes of the strains under analysis, suggesting frequent events of genomic reorganization. Also, pangenome analyzes show a scenario in which more genomes of this species are needed for the estimation of the total amount of different genes the species may possess, which is interesting for future studies conserning secondary metabolites. Coregenome analyzes point to a reliable estimate of 1,944 genes common to all genomes of this species, which corresponds to 30% up to 50% of the genes in each strain. Statistical analyzes point to different degrees of non-linear interference of the number of contiguous sequences on the observation of different patterns of other genomic characteristics, suggesting necessary caution about expectations regarding the secondary metabolism in case of strains in which the gene assembly exceeds the approximate upper limit of 100 contiguous sequences.
15

Genômica comparativa de Microcystis aeruginosa (Cyanobacteria: Chroococcales), com ênfase em genes envolvidos com síntese de produtos naturais / Comparative genomics of Microcystis aeruginosa (Cyanobacteria: Chroococales), with emphasis on genes related to natural product synthesis

Bruno Weiss 04 April 2017 (has links)
A ampla diversidade metabólica das cianobactérias é associada não somente a sua importância nos ciclos biogeoquímicos, mas também a sua distribuição global. Tal característica também é responsável pela capacidade destes organismos em produzir uma ampla variedade de substâncias de estruturas incomuns e atividades de interesse para o homem. Microcystis é um gênero cianobacteriano reconhecido como produtor de mais de duas centenas de produtos naturais, incluindo cianotoxinas. Microcystis aeruginosa é uma espécie frequentemente encontrada em florações, portanto causando preocupações sobre sua influência ecológica, especialmente em corpos d\'água doce utilizados para consumo humano. Desta forma, o objetivo deste trabalho foi o levantamento da diversidade e quantidade de metabólitos secundários que podem ser produzidos pela espécie, através de análises genômicas, além de variáveis que podem potencialmente interferir nas análises computacionais, procurando-se por padrões na espécie, e comparando-se 18 linhagens de todos os continentes. Foi encontrado o total de 235 agrupamentos relacionados ao metabolismo secundário, categorizados em 12 classes segundo as estruturas de seus produtos, nas 18 linhagens, evidenciando a riqueza de agrupamentos relacionados ao metabolismo secundário encontrados nesta espécie. Destes agrupamentos, os mais abundantes pertencem às categorias dos Terpenos, Híbridos, Bacteriocinas e NRPS. Entre as NRPS, nenhuma foi comum a todas as linhagens. Ainda, a quantidade de agrupamentos variou entre 6 e 21, e a quantidade de categorias de produtos variou entre 4 e 10, mostrando uma distribuição heterogênea de agrupamentos e tipos de metabólitos preditos. Esta distribuição heterogênea foi detalhada para melhor compreensão deste padrão encontrado na espécie. Dos agrupamentos de NRPS, os três mais frequentes foram selecionados para uma análise pormenorizada de sua estrutura e sequência: aeruginosina (15 linhagens), microcistina (11 linhagens), e micropeptina (15 linhagens). O agrupamento de micropeptina encontrado nas linhagens SPC777, TAIHU98 e PCC 9806 se mostrou amplamente dissimilar com relação à referência utilizada, potencialmente indicando um erro de identificação causado pela plataforma antiSMASH utilizada para a localização dos agrupamentos. Análises de colinearidade genômica mostram uma baixíssima sintenia entre os genomas das linhagens em análise, sugerindo frequentes eventos de reorganização genômica. Ainda, análises de pangenoma mostram um cenário em que mais genomas desta espécie são necessários para a estimativa da quantidade total de genes diferentes que a espécie pode possuir, o que é interessante para futuros estudos de procura de metabólitos secundários. Análises do genoma cerne apontam para uma estimativa segura de 1.944 genes comuns a todos os genomas desta espécie, o que corresponde entre 35% e 50% dos genes em cada linhagem. Análises estatísticas apontam para diferentes graus de interferência não linear da quantidade de sequências contíguas na observação de diferentes padrões de outras características genômicas, sugerindo precaução nas expectativas com relação ao metabolismo secundário em caso de linhagens em que a montagem gênica ultrapasse o limite superior aproximado de 100 sequências contíguas. / The wide metabolic diversity of cyanobacteria is associated not only with their importance in biogeochemical cycles, but also with their global distribution. Such a feature is also responsible for the ability of these organisms to produce a wide variety of substances with unusual structures and activities of interest to man. Microcystis is a cyanobacterial genus recognized as a producer of more than two hundred natural products, including cyanotoxins. Microcystis aeruginosa is a species frequently found in cyanobacterial blooms, thus causing concerns about its ecological influence, especially in freshwater bodies used for human consumption. In this way, the objective of this work was the survey of the diversity and quantity of secondary metabolites that can be produced by the species, through genomic analyzes, besides variables that can potentially interfere in the computational analyzes, searching for patterns in the species, and comparing 18 strains from all the continents. A total of 235 clusters, categorized in 12 classes according to the structure of their products, were found in the 18 strains, evidencing the richness of clusters related to the secondary metabolism found in this species. Of these clusters, the most abundant belong to the categories of Terpenes, Hybrids, Bacteriocins and NRPS. Among NRPS, none were common to all strains. Also, the number of groups ranged from 6 to 21, and the number of product categories ranged from 4 to 10, showing a heterogeneous distribution of predicted groupings and types of metabolites. Such a heterogeneous distribution was detailed for a better understanding of this pattern found in the species. Of the NRPS clusters, the three most frequent were selected for a detailed analysis of their structure and sequence: aeruginosin (15 strains), microcystin (11 strains), and micropeptin (15 strains). The micropeptide cluster found in the SPC777, TAIHU98 and PCC 9806 strains was widely dissimilar to the reference, só potentially indicating an identification error caused by the antiSMASH platform used to locate the clusters. Genomic collinearity analyzes showed a very low synteny among the genomes of the strains under analysis, suggesting frequent events of genomic reorganization. Also, pangenome analyzes show a scenario in which more genomes of this species are needed for the estimation of the total amount of different genes the species may possess, which is interesting for future studies conserning secondary metabolites. Coregenome analyzes point to a reliable estimate of 1,944 genes common to all genomes of this species, which corresponds to 30% up to 50% of the genes in each strain. Statistical analyzes point to different degrees of non-linear interference of the number of contiguous sequences on the observation of different patterns of other genomic characteristics, suggesting necessary caution about expectations regarding the secondary metabolism in case of strains in which the gene assembly exceeds the approximate upper limit of 100 contiguous sequences.
16

Identificação e análise de sequências codificantes com atributos conflitantes em genomas procariotos / Analysis and identification of prokaryotic coding sequences with confliting atributes eng

Saji, Guadalupe Del Rosario Quispe 23 August 2010 (has links)
Made available in DSpace on 2015-03-04T18:50:29Z (GMT). No. of bitstreams: 1 Dissertacao_Guadalupe.pdf: 2696610 bytes, checksum: c3a517f1d7dc8a87a7bf76c7a5e845aa (MD5) Previous issue date: 2010-08-23 / Coordenacao de Aperfeicoamento de Pessoal de Nivel Superior / The advent of new sequencing technologies and the development of computational tools that facilitate the analysis of genomes, generated the exponential growth of genome databases. New approaches in-silico of the comparative genomics use such data in its comparisons. Nevertheless, recent work on the genome of Escherichia coli indicate that the current state of coding sequences (Coding Sequences - CDS) from annotated genomes contain several errors, which need to be verified (Ochman e Davalos 2006). Therefore the correct description of a CDS is important to allow future genomic comparisons. Currently, there is an innovated proposal of the scientific community of biological databases to establish standards for the submission of the draft genome sequences in the new era of sequencing. Within this context, it is highlighted the identification and/or correction of frameshifts during the assembly of genomic sequences. The goal of this work was developing a tool with two comparative methods to identify CDSs with conflicting attributes. It uses the description of conflict to describe attributes such as frameshifts, large insertions or deletions, truncations, etc.. that are detected from a CDS or several CDSs used as references, depending on model. Also, the proposed tool allows to user to view of the results graphically and provide access to other tools, providing support for future friendly and faster genomic analysis. As a model of study, it was used the analysis of CDSs with conflicting attributes of the genome of E. coli strain CFT073 (NCBI) version AE014075.1, (last update date: April 20 of 2006), with this purpose was used as a reference genome of E.coli strain O157: H7 EDL933 version AE005174.2 (last update date: 6 June of 2008). Through this analysis were identified and stored 1865 CDSs (Included possible paralogs) because they present only alignments with coverage exceeding 30% of the CSD of reference. In a more detailed analysis of these results, 144 CDSs startle in the target genome by probably present frameshifts, of which 21 occur in intergenic regions. The tool developed in this work, also was applied to the case study of a genomic region of the bacterium Klebsiella pneumoniae strain KP13. The genome of this bacterium was sequenced in Computational Genomics Unit (UGC) Darcy Fontoura de Almeida LNCC (unpublished data). From the analysis of these genomes, one can conclude the importance of using the tool in the stages of identification, verification and correction of errors in annotation,and thus the need for its inclusion in the sequencing projects that want to reach high standards in the submission of genomic data. / O advento de novas tecnologias de sequenciamento e o desenvolvimento de ferramentas computacionais que facilitam a análise dos genomas gerou o aumento exponencial dos bancos de dados genômicos. As abordagens in-silico da genômica comparativa usam esse tipo de dados nas suas comparações. Trabalhos recentes desenvolvidos sobre o genoma de Escherichia coli indicam que o estado atual das sequências codificantes (CoDing Sequences CDS) de genomas anotados nos bancos de dados contêm erros nas sequências que precisam ser verificados (Ochman e Davalos 2006). Portanto a correta descrição de uma CDS é importante para permitir futuras comparações genômicas. Atualmente existe uma nova proposta da comunidade científica de bancos de dados biológicos para estabelecer padrões para a submissão de sequências dos projetos de genoma na nova era de sequenciamento. Dentro desse contexto, destaca-se a identificação e/ou correção de frameshifts durante o processo de montagem de sequências genômicas. A finalidade deste trabalho foi desenvolver uma ferramenta com dois métodos comparativos para identificar CDSs com atributos conflitantes. Usa-se a descrição de conflito para descrever atributos como frameshifts , grandes inserções ou deleções, truncamentos, que são detectados a partir de uma CDS ou várias CDSs usadas como referência, dependendo do modelo. Finalmente, a ferramenta proposta permite visualizar os resultados graficamente e fornecer acesso a outras ferramentas, dando suporte para futuras análises genômicas de maneira amigável e rápida. Foi realizada a busca de CDSs com atributos conflitantes no genoma de E. coli estirpe CFT073 (NCBI) versão AE014075.1, (última data de atualização: 20 de abril do 2006), como referência foi usado o genoma da E.coli estirpe O157:H7 EDL933 versão AE005174.2 ( última data de atualização : 6 de junho do 2008). Através dessa análise foram identificadas e armazenadas 1.865 CDSs (incluem-se possíveis parálogos), por apresentarem alinhamentos únicos com cobertura superior a 30% da CDS de referência. Em uma análise mais fina destes resultados, sobressaltam 144 CDSs no genoma alvo que provavelmente apresentam frameshifts , dos quais 21 acontecem em regiões intergênicas. A ferramenta desenvolvida neste trabalho foi também aplicada para o caso de estudo de uma região genômica da bactéria Klebsiella pneumoniae estirpe KP13. O genoma dessa bactéria foi sequenciado na Unidade Genômica Computacional (UGC) Darcy Fontoura de Almeida do LNCC (dados ainda não publicados). A partir das análises destes genomas, pode se concluir a importância do uso da ferramenta nas fases de identificação, verificação e correção de erros de anotação e, portanto a necessidade da sua inclusão em projetos de sequenciamento que desejam atingir altos padrões na submissão de dados genômicos.
17

Caracterização e análise comparativa de genomas de estirpes de Leptospira isoladas no Brasil / Characterization and comparative genomic analysis of Leptospira strains isolated in Brazil

Moreno, Luisa Zanolli 20 April 2017 (has links)
O presente estudo teve como objetivo caracterizar o genoma de estirpes de Leptospira isoladas no Brasil e realizar a análise comparativa destes com os genomas disponíveis no banco de dados GenBank. Foram caracterizadas 17 estirpes isoladas de distintas espécies animais, em diferentes regiões do Brasil, no período de 1998 a 2012. Estas foram previamente tipificadas por sequenciamento do gene 16S rRNA e soroaglutinção microscópica em seis espécies (L. interrogans, L. santarosai, L. inadai, L. kirschneri, L. borgpetersenii e L. noguchii) e mais de oito sorogrupos. Foi realizado o sequenciamento em plataforma Illumina™ MiSeq e montagem dos genomas com algoritmo ab initio. Para ordenação e anotação foram utilizados genomas de referência das respectivas espécies estudadas. Foi realizada a análise in silico da Tipagem por Sequenciamento de Multilocus (MLST) para os três protocolos vigentes de Leptospira. A análise comparativa dos genomas, incluindo wgSNP, foi realizada intra-espécie avaliando as variações existentes entre os sorogrupos das espécies de Leptospira estudadas. As estirpes de L. interrogans apresentaram resultados na MLST congruentes com a sua identificação prévia. No caso de L. kirschneri, apenas uma estirpe apresentou novos alelos nos três protocolos de MLST e se distancia das demais estirpes brasileiras de L. kirschneri. As estirpes de L. santarosai, assim como as de L. borgpetersenii e L. noguchii, possuem novos alelos e/ou perfis alélicos para pelo menos dois dos protocolos vigentes de MLST, sendo que ainda se destacam em um agrupamento próprio de origem brasileira. Os genomas de L. interrogans apesar de apresentarem alta identidade e sintenia com a referência sorovar Copenhageni, também apresentaram regiões de diferença entre os respectivos sorogrupos. Os genomas dos sorogrupos Australis e Serjoe se destacaram por apresentarem inserções e deleções, respectivamente, principalmente no cromossomo 2. O genoma de L. borgpetersenii também apresentou grande variação de composição, como esperado para espécie, sendo esta proporcionada por sequências de inserção e transposição de elementos móveis. Os sorogrupos Canicola e Pomona apresentaram maior proximidade entre si na análise wgSNP. Também foram identificados dois plasmídeos nos genomas do sorogrupo Canicola com alta identidade aos plasmídeos descritos na estirpe chinesa do mesmo sorovar. Na espécie L. kirschneri, a estirpe 47 (M36/05) apresentou alta identidade e sintenia com os genomas do sorovar Mozdok, como esperado, incluindo a estirpe brasileira de origem humana. Já a estirpe 55 (M110/06) se diferenciou dos demais genomas de L. kirschneri tanto no MLST quanto no wgSNP. O genoma brasileiro de L. inadai apresentou alta identidade à referência americana de origem humana, incluindo a presença de um bacteriófago próprio da espécie. A distinção das estirpes brasileiras de L. santarosai na MLST, também foi evidenciada na análise comparativa e no wgSNP, sendo que a estirpe 68 (M52/8-19), que não apresentou reatividade aos sorogrupos testados, ainda se diferencia das demais reafirmando a possibilidade de novo sorogrupo/sorovar. Dessa forma, o estudo genômico possibilitou a identificação de particularidades das estirpes brasileiras de Leptospira, incluindo a existência de elementos extra-cromossomais, proximidade com estirpes de origem humana indicando maior risco para saúde pública, além da possibilidade de novo sorogrupo de L. santarosai. / The present study aimed to characterize the genome of Leptospira strains isolated in Brazil and to perform their comparative analysis with GenBank available genomes. 17 strains isolated from distinct species, in different regions of Brazil, from 1998 to 2012 were characterized. These were previously typified through 16S rRNA sequencing and microscopic agglutination into six species (L. interrogans, L. santarosai, L. inadai, L. kirschneri, L. borgpetersenii and L. noguchii) and over eight serogroups. Illumina™ MiSeq sequencing and genome assembly with ab initio algorithm were performed. For ordering and annotation, reference genomes of the respective species were used. The in silico analysis of Multilocus Sequencing Typing (MLST) was performed for the three current Leptospira protocols. The comparative genomic analysis, including wgSNP, was performed intra-species evaluating the existing variations between the serogroups of the studied Leptospira species. The L. interrogans strains presented MLST results congruent with their previous identification. In the case of L. kirschneri, only one strain presented new alleles in the three MLST protocols and distanced itself from the other Brazilian L. kirschneri strains. The L. santarosai strains, as well as L. borgpetersenii and L. noguchii, presented new alleles and/or allelic profiles for at least two of the current MLST protocols, and still stand out in a separate group of Brazilian origin. Even though the L. interrogans genomes presented high identity and synteny with serovar Copenhageni reference, they also presented regions of difference between the respective serogroups. Serogroups Australis and Serjoe genomes stood out for having insertions and deletions, respectively, mainly in chromosome 2. The L. borgpetersenii genome also presented great variation of composition, as expected for the species, which is provided by insertion sequences and transposition of mobile elements. The serogroups Canicola and Pomona presented higher proximity in the wgSNP analysis. Two plasmids were also identified in the serogroup Canicola genomes with high identity to the plasmids described in the Chinese strain of the same serovar. In the L. kirschneri species, the strain 47 (M36/05) presented high identity and synteny with the serovar Mozdok genomes, as expected, including the Brazilian strain of human origin. The strain 55 (M110/06) differed from other L. kirschneri genomes in both MLST and wgSNP. The Brazilian L. inadai genome presented high identity to the American reference of human origin including the presence of bacteriophage specific for the species. The distinction of the Brazilian L. santarosai strains in the MLST was also evidenced in the comparative analysis and in the wgSNP, and the strain 68 (M52 / 8-19), which showed no reactivity to the tested serogroups, also differs from the others reaffirming the possibility of a new serogroup/serovar. Therefore, the genomic study allowed the identification of particularities of Brazilian Leptospira strains, including the existence of extrachromosomal elements, proximity to strains of human origin indicating a greater risk for public health, in addition to the possibility of a new L. santarosai serogroup.
18

Ferramentas computacionais para o estudo estrutural e funcional de genes de dermatófitos potencialmente envolvidos na patogenicidade / Computational tools for the structural and functional study of dermatophytes genes potentially involved in pathogenicity

Sanches, Pablo Rodrigo 16 September 2015 (has links)
Dermatófitos são fungos filamentosos que infectam substratos queratinizados como pele, unha e cabelo em busca de nutrientes para se desenvolverem e permanecerem no hospedeiro. Pertencem aos gêneros Epidermophyton, Microsporum ou Trichophyton, os quais, dependendo de seu habitat natural, são classificados em espécies geofílicas, zoofílicas ou antropofílicas. O uso indiscriminado de antifúngicos levou à seleção de cepas resistentes, e o comportamento invasivo desses patógenos em pacientes imunodeprimidos aumentou nos últimos anos, dificultando o tratamento das dermatofitoses. Há, portanto, a necessidade de estudos para um melhor entendimento da biologia dos dermatófitos devido as suas importâncias médica e/ou veterinária e o escasso conhecimento da interação destes patógenos com os hospedeiros. No presente trabalho, analisamos oito espécies de dermatófitos: Arthroderma benhamiae, Microsporum canis, Microsporum gypseum, Trichophyton interdigitale, Trichophyton equinum, Trichophyton rubrum, Trichophyton tonsurans e Trichophyton verrucosum. Análises de genômica comparativa e de expressão de genes potencialmente envolvidos na degradação de queratina foram realizadas. Além disso, efetuamos o sequenciamento genômico em larga escala de uma das linhagens. A estrutura dos genes sub3, sub5 e sub7, que codificam serina endopeptidases com atividade queratinolítica, mep3 e mep4, que codificam proteínas pertencentes ao grupo das metaloendopeptidases, dppV, lap1 e lap2, que codificam exopeptidases, foi analisada por meio de ferramentas computacionais. Essas análises revelaram que os genes que codificam proteases possuem alto grau de conservação em suas estruturas, que é menor quando comparadas apenas suas regiões não codificadoras. As análises permitiram também a identificação em regiões promotoras de consensos específicos a gêneros de dermatófitos. Observamos que o acúmulo de transcritos destes genes, avaliados durante o cultivo em queratina, mimetizando o processo infeccioso, não está correlacionado à similaridade das sequências gênicas entre as espécies. Não encontramos correlação entre o nicho preferencial dos dermatófitos e suas sequências gênicas ou níveis transcricionais. Observamos que, na grande maioria das vezes, genes que codificam endo e exopeptidases, possuem acúmulo de transcritos em períodos iniciais de degradação de queratina. Nossos resultados sugerem que diferenças pontuais na sequencia gênica, diferenças em regiões promotoras ou, até mesmo, expressão variável destes genes que codificam um conjunto proteico com funções sinérgicas e provavelmente compensatórias, contribuam para os diferentes graus de reações inflamatórias no hospedeiro, bem como para a especificidade patógeno-hospedeiro. / Dermatophytes are filamentous fungi that infect keratinized substrates such as skin, nail and hair, searching for nutrients for their development and permanence in the host. They belong to the genera Epidermophyton, Microsporum or Trichophyton, and, depending on their natural habitat, are classified into geophilics, zoophilics or anthropophilics species. The indiscriminate use of antifungals has led to the selection of resistant strains, and the invasive behaviour of these pathogens in immunocompromised patients increased in the last years, hampering the treatment of the dermatophytoses. Therefore, there is a need of studies for a better understanding of the biology of the dermatophytes due to their medical and/or veterinary importance and the scarce knowledge about the interaction of these pathogens with their hosts. In this work, we analyzed eight species of dermatophytes: Arthroderma benhamiae, Microsporum canis, Microsporum gypseum, Trichophyton interdigitale, Trichophyton equinum, Trichophyton rubrum, Trichophyton tonsurans, and Trichophyton verrucosum. Comparative genomics and gene expression analyses of genes potentially involved in keratin degradation were performed. Moreover, we performed a large-scale genome sequencing of one of the strains. The structure of the genes sub3, sub5, and sub7, which encode serine endopeptidases with keratinolytic activity, mep3, and mep4, which encode proteins belonging to the group of the metalloendopeptidases, dppV, lap1, and lap2, encoding exopeptidases, were analyzed by computational tools. These analyses revealed that the genes encoding proteases possesses high degree of conservation in their structures, which are lower when their non-coding regions are compared. The analyses also allowed the identification of consensus in promoter regions, specific of dermatophytes genera. We observed that the transcripts accumulation of these genes, evaluated during the cultivation in keratin, mimicking the infection process, is not correlated to the gene sequence similarities among the species. We have not found any correlation between the preferential niche of dermatophytes and their gene sequences or transcription levels. Most of the times, we observed that genes encoding endo and exopeptidases accumulated transcripts at the beginning of keratin degradation. Our results suggest that specific differences in the genic sequencing, differences in promoter regions, or even variable expression of these genes encoding a set of proteins with synergic and probably compensatory functions, contribute to different levels of inflammatory reactions in the host, as well as to the host-pathogen specificity.
19

Reconstrução filogenética de procariotos com base em famílias de genes homólogos / Phylogenetic reconstruction of prokaryotes based on homologous gene families

Vivian Mayumi Yamassaki Pereira 03 April 2017 (has links)
A comparação de genomas é uma importante tarefa na qual a bioinformática pode ser aplicada, uma vez que ela permite a identificação de genes patogênicos, o que, por sua vez, pode auxiliar a combater ou a prevenir o surgimento de doenças. A partir da comparação de genomas, também é possível realizar a análise filogenética, que permite entender as relações evolutivas entre diferentes organismos. Em genomas de bactérias, essa análise geralmente é realizada com base no gene 16S rRNA. Entretanto, apesar de ser amplamente utilizado, filogenias com base nesse gene podem ter dificuldades para diferenciar organismos muito próximos evolutivamente. Essa importância da comparação de genomas e a necessidade de uma metodologia que permita distinguir organismos evolutivamente próximos na análise filogenética motivaram este trabalho, que teve como objetivo implementar ferramentas computacionais para identificar genes homólogos em genomas e, com base nesses genes, gerar filogenias e analisar se é possível distinguir os organismos evolutivamente próximos nessas filogenias. Para tanto, as ferramentas desenvolvidas para identificação de genes homólogos recebem resultados de alinhamentos e os filtram, de modo que dois genes são considerados homólogos se o alinhamento entre eles satisfizer os limiares definidos. Após a identificação das famílias de genes homólogos, tabelas são geradas com informações a respeito dos genes homólogos em cada genoma e, com base nessas tabelas, é possível gerar matrizes de distância e utilizar métodos de agrupamento hierárquico para a geração da filogenia ou realizar alinhamentos múltiplos com os genes identificados para posterior reconstrução filogenética. Além disso, também é possível representar os genes e famílias de genes homólogos por meio de um grafo, que pode auxiliar na escolha dos limiares para filtrar os alinhamentos. Para demonstrar e analisar a aplicabilidade das ferramentas desenvolvidas e das abordagens adotadas, experimentos foram realizados utilizando genomas de bactérias do gênero Xanthomonas, que contém um grande grupo de bactérias que causam doenças em plantas. Os resultados obtidos foram então comparados com filogenias de referência e com resultados de outros experimentos realizados. Essas comparações demonstraram que as famílias de genes homólogos podem ser úteis para distinguir genomas de organismos muito próximos evolutivamente, apesar de que essa abordagem apresentou dificuldades para separar os grupos de genomas mais distantes. Em contrapartida, na filogenia gerada a partir da região 16S rRNA, foi possível diferenciar esses organismos mais distantes, mas não foi possível distinguir os organismos muito próximos. Por fim, os experimentos realizados fornecem indícios de que as ferramentas desenvolvidas e as abordagens adotadas podem ser úteis para diferenciar genomas muito próximos evolutivamente de outros procariotos além das bactérias estudadas neste trabalho / Genome comparison is an important task on which bioinformatics can be used because it allows the identification of pathogen genes which can aid the combat of diseases and to avoid the emerging of new ones. Genome comparison also allows the phylogenetic analysis which provides the understanding of evolutional relations of different organisms. In bacterial genomes, this analysis is commonly based on 16S rRNA gene. Unfortunately, it can present some difficulties to distinguish closely related organisms. This importance of genome comparison and the necessity of a methodology to distinguish organisms that are closely related motivated this study, which aimed the development of computational tools to identify homologous genes in genomes, to use these genes to reconstruct phylogenies and to analyze if it is possible to distinguish closely related organisms on these phylogenies. To achieve this purpose, the developed tools to identify homologous genes receive the alignments results and filter it, such that two genes are homologous if their alignment satisfies the thresholds. After the identification of homologous gene families, the tools generates tables with information about the homologous genes presents in each genome and with these tables it is possible to create distance matrix to be used by hierarchical clustering methods to generate phylogenies or it is possible to perform multiple alignments with the identified genes to accomplish a phylogenetic reconstruction. Besides that, it is possible to represent the genes and homologous gene families in a graph, which can aid the choice of the thresholds to filter the alignments. To demonstrate and analyze the applicability of the developed tools and the approaches chosen in this study, experiments were performed using genomes of the bacterial genus Xanthomonas, which include a group of phytopathogenic bacteria. The results obtained were compared with reference phylogenies and with results of other experiments. These comparisons showed that homologous gene families can be used to differentiate closely related organisms, despite the fact that it presented difficulties to distinguish the groups of genomes that were evolutionarily far from each other. On the other hand, the phylogeny based on 16S rRNA region allows to distinguish the groups of genomes that were distant, but it was not possible to differentiate closely related organisms. As a conclusion, the experiments performed give pieces of evidence that the developed tools and the approaches adopted can be useful to distinguish genomes of closely related organisms of other prokaryotes besides the bacterias considered in this study
20

GINGA - Graphical Interface for Comparative Genome Analysis: o desenvolvimento de um sistema computacional de visualização gráfica para a análise comparativa de genomas de bactérias / GINGA - Graphical Interface for comparative Genome Analysis: development of a computational system to visualize the comparative of bacterial genomes in a graphical view

Alexandre Rossi Paschoal 23 March 2007 (has links)
Esta dissertação resultou de um sistema computacional voltado para a visualização gráfica de análises comparativas entre genomas de procariotos. O sistema denominado de GINGA Graphical Interface for comparative Genome Analysis foi desenvolvido basicamente para analisar genomas parcialmente seqüenciados por meio da comparação com genomas completos. O sistema mostra a representação do alinhamento entre seqüências de reads, contigs e scaffolds do genoma parcial com a seqüência completa do outro genoma, permitindo a identificação de blocos comuns, regiões específicas e rearranjos. GINGA é um sistema web-based que foi desenvolvido em linguagem PERL para acessar um banco de dados MySQL, onde estão armazenadas as informações obtidas nas análises comparativas. O módulo de interface da biblioteca gráfica GD da linguagem PERL foi utilizado para a construção da ferramenta de visualização. A representação gráfica criada permite a navegação com opções de zoom in/out, disponibilizando as informações de montagem, anotação das seqüências codificadoras e da organização das seqüências entre os genomas. Relatórios são ainda disponibilizados como fonte complementar da apresentação dos resultados. O sistema GINGA foi utilizado para analisar de maneira comparativa o genoma das bactérias Leifsonia xyli subsp. cynodontis (Lxc genoma parcialmente seqüenciado) e Leifsonia xyli subsp. xyli (Lxx genoma completamente seqüenciado). Lxx provoca o raquitismo da soqueria em cana-de-açúcar, enquanto Lxc é capaz de colonizar cana-de-açúcar sem provocar sintomas de doença. O objetivo foi revelar, ainda durante o processo de seqüenciamento do genoma de Lxc, diferenças genéticas existentes entre os genomas dessas duas bactérias. Fizeram parte das análises comparativas um total de 9.754 reads do genoma de Lxc que formaram 1.064 contigs e 317 scaffolds, totalizando 1.470.731 de bases não redundantes. GINGA permitiu a identificação de 206.320 bases (~19%) em seqüências de contigs específicos (contigs que não apresentaram alinhamento algum com o genoma completo de Lxx) e 19 scaffolds (5,9%) que totalizaram 56.884 bases específicas ao genoma de Lxc, além de aproximadamente 1 milhão de nucleotídeos alinhados ao genoma de Lxx e pelo menos 6 grandes rearranjos. Estes resultados foram disponibilizados em uma interface gráfica e relatórios, permitindo orientar o andamento do projeto de seqüenciamento do genoma de Lxc quanto à seleção das regiões a serem seqüenciadas e, simultaneamente, oferecendo informações para a formalização de hipóteses relevantes à biologia destes microorganismos. / This study aimed to develop a computational system applied to the comparative analysis of prokaryotic genomes in a graphical view. The system named GINGA Graphical Interface for comparative Genome Analysis was developed to analyse a draft genome sequence in comparison to a complete genome. The system shows the alignment between sequence of reads, contigs and scaffolds from partial sequenced genomes and the complete sequence of another genome and allows the identification shared and unique regions as well as rearrangements. GINGA is a web-based system developed using the PERL language to access a MySQL database where all the information regard to the comparative analysis is stored. The module of the interface to GD (Graphics Library) was used to help the construction of the graphical tool. The graphical view allows zoom in/out on the information on assembly, annotation and the organization of the sequences. Supplementary information can be accessed in the form of reports. GINGA system was used to compare the genomes of Leifsonia xyli subsp. cynodontis (Lxc draft genome sequence) and Leifsonia xyli subsp. xyli (Lxx complete genome sequence). The mail goal was to identify genetic differences that may help to understand the pathogeniciy of Lxx towards sugarcane. A total of 9.754 reads assembled in 1.064 contigs and 317 scaffolds produced 1.470.731 of no redundant bases of Lxc genome and were used in the analysis. GINGA allowed the identification of 206.320 bp (~20%) of Lxc specific sequences organized in contigs and 56.884 bp organized in 19 scaffolds (5,9%), around 1 milion bp aligned to Lxx genome and at least 6 large scale genomic rearrangements. These results were presented in a graphical interface and allowed to guide the partial genome sequencing, helping to decide which regions should be further sequenced and at the same time allowing the formulation of hypothesis related to important biological aspects of these microorganisms

Page generated in 0.1245 seconds