Return to search

Montagem e caracterização do transcritoma de cana-de-açúcar (saccharum spp.) utilizando dados de sequenciamento de nova geração / Assembly and characterization of sugarcane (Saccharum spp.) transcriptome using next generation sequencing data

Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2015-10-27T13:50:34Z
No. of bitstreams: 2
Tese - Arthur Tavares de Oliveira Melo - 2015.pdf: 5375267 bytes, checksum: 306e8d72c2977068f8f669824b83ca4b (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-10-27T14:08:47Z (GMT) No. of bitstreams: 2
Tese - Arthur Tavares de Oliveira Melo - 2015.pdf: 5375267 bytes, checksum: 306e8d72c2977068f8f669824b83ca4b (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-10-27T14:08:47Z (GMT). No. of bitstreams: 2
Tese - Arthur Tavares de Oliveira Melo - 2015.pdf: 5375267 bytes, checksum: 306e8d72c2977068f8f669824b83ca4b (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2015-01-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The sugarcane is one of the most important crop species to provide sugar and
renewable energy in the world. Due to the high amount of repetitive elements and the
various polyploidization events suffer during its evolution, the Saccharum spp. genome has
not yet been assembled and annotated, unlike other agronomic important species. So, the
knowledge about sugarcane transcriptome become even more useful for supporting
genomic analyzes studies. A draft assembly of sugarcane transcriptome was obtained from
Illumina sequencing paired-ends libraries of five different plant organs, sampled from
thirty elite clones. Analyzes of quality control and normalization was done in the RNA-seq
data. Trinity package was used for de novo assembly. The scaffolds obtained and identified
as complete ORFs were annotated according to Gene Ontology terms. The draft assembly
was characterized by the identification of microsatellites and SNPs molecular markers and
for assessing the contribution of different plant organs for transcriptome final assembly.
The draft sugarcane transcriptome comprised 178 Mb, over 131,831 scaffolds, representing
61,225 genes. The transcripts average size was 1,350 bp and N50 value was 1,667 bp. A
total of 1,250 transcripts identified as complete ORFs showed no similarity to sequences of
the nr NCBI database, are considered new Transcript Active Regions (nTARs). The
annotation performed using the KEGG database identified 234 transcripts coding for
enzymes members of sucrose and starch metabolism, an important metabolic pathway for
understanding the relationship between photosynthetic rate and sucrose accumulation in
the stalk. The five plant organs used contributed equally for the draft sugarcane
transcriptome. A total of 12,931 genomic regions were identified containing perfect
microsatellites, with a predominance of di and tri nucleotide. On average, one SNP every
18 bp was identified, with more than four million SNPs identified with satisfactory values
of haplotype and quality scores. The nucleotide diversity of thirty elite clones used in this
study was high. The identification of these molecular markers, particularly SNPs markers,
provides the possibility of using these polymorphisms in genomic and genetic studies of
sugarcane, including the possibility of application of genome wide selection like breeding
strategy. The sugarcane transcriptome draft assembly proposed in this study has data and
analysis quality sufficient to be used in attempt to encompass a reference transcriptome for
the species of Saccharum spp. / A cana-de-açúcar é uma das principais espécies cultivadas para o fornecimento mundial de
açúcar e energia renovável. Devido à elevada quantidade de elementos repetitivos e os
vários eventos de poliploidização, o genoma da espécie ainda não foi montado e anotado,
diferentemente de outras espécies de interesse agronômico. Assim, as informações do
transcritoma da espécie se tornam ainda mais úteis por dar suporte ás iniciativas de análises
genômicas. Um draft assembly do transcritoma de cana-de-açúcar foi montado a partir do
sequenciamento Illumina de bibliotecas paired-ends de cinco órgãos distintos da planta,
obtidos de uma amostra de trinta clones elite. Os dados de RNA-seq passaram por análises
de controle de qualidade e normalização. O software Trinity foi utilizado para montagem
de novo do transcritoma. Os scaffolds obtidos identificados como ORFs completas foram
anotados conforme os termos do Gene Ontology. O draft assembly obtido para o
transcritoma de cana-de-açúcar foi caracterizado pela identificação de marcadores
moleculares do tipo microssatélites e SNPs e pela avaliação da contribuição dos diferentes
órgãos vegetais para constituição final do transcritoma. O transcritoma obtido
compreendeu 178 Mb, distribuídos em 131.831 scaffolds, representando 61.225 genes. O
tamanho médio dos transcritos foi de 1.350 pb, com valor de N50 igual a 1.667 pb. Um
total de 1.250 transcritos, identificados como ORFs completas, não apresentaram
similaridade com sequências do banco de dados nr do NCBI, sendo considerados novas
regiões transcricionalmente ativas (nTARs). A anotação realizada através do banco de
dados do KEGG identificou 234 transcritos codificantes para enzimas integrantes do
metabolismo de sacarose e amido, uma importante rota metabólica para compreensão da
relação entre taxa fotossintética e o acúmulo de sacarose no colmo. Os cinco órgãos
vegetais utilizados contribuíram igualmente para a constituição do draft do transcritoma de
cana-de-açúcar. Foram identificadas 12.931 regiões genômicas contendo microssatélites
perfeitos, com predomínio de di e tri nucleotídeos. Em média, identificou-se um SNP a
cada 18 pares de bases, com mais de quatro milhões de SNPs identificados. A diversidade
nucleotídica dos trinta clones elites utilizados é elevada. A identificação destes marcadores
moleculares, principalmente os marcadores SNPs, fornece a possibilidade de utilização
destes polimorfismos em estudos genéticos e genômicos de cana-de-açúcar, incluindo o
emprego em abordagens como seleção genômica ampla no melhoramento da espécie. O
draft assembly do transcritoma de cana-de-açúcar proposto neste estudo possui qualidade
de dados e de análise suficiente para ser utilizado na tentativa de abranger um transcritoma
de referência para as espécies de Saccharum spp.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.bc.ufg.br:tede/4783
Date22 January 2015
CreatorsMelo, Arthur Tavares de Oliveira
ContributorsCoelho, Alexandre Siqueira Guedes, Coelho, Alexandre Siqueira Guedes, Pappas Júnior, Georgios Joannis, Borba, Tereza Cristina de Oliveira, Brondani , Cláudio, Novaes, Evandro
PublisherUniversidade Federal de Goiás, Programa de Pós-graduação em Genetica e Melhoramentode Plantas, UFG, Brasil, Escola de Agronomia e Engenharia de Alimentos - EAEA (RG)
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFG, instname:Universidade Federal de Goiás, instacron:UFG
Rightshttp://creativecommons.org/licenses/by-nc-nd/4.0/, info:eu-repo/semantics/openAccess
Relation1167494949003462214, 600, 600, 600, 600, 4500684695727928426, -3091138714907603907, 2075167498588264571

Page generated in 0.0042 seconds