Return to search

Caracterização da região Bru1 no genoma da cultivar RB867515 (Saccharum spp.) utilizando sequenciamento de nova geração / Characterization of Bru1 region of sugarcane cultivar RB867515 using next generation sequencing

Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2017-04-18T14:12:04Z
No. of bitstreams: 2
Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-04-18T14:13:10Z (GMT) No. of bitstreams: 2
Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-04-18T14:13:10Z (GMT). No. of bitstreams: 2
Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2014-09-25 / Financiadora de Estudos e Projetos- Finep / Outro / Sugarcane is known as one of the most important crops of the word for its sub products utilization.
Four countries, led by Brazil, supply the sugar international trade. Ethanol is other important
sugarcane sub product, recognized as an alternative product to sugar, and had great demand in
Brazilian trade, for its utilization as non-fossil fuel. The sugarcane genome is one of the most
complex among crops, with 10 Gb. Its complete genome is not available, but the recent innovations
in genomics tools open up new possibilities for the investigations about the sugarcane’s genome.
We did a genome assembly and annotation of a Brazilian sugarcane cultivar (RB867515) genome
region, correspondent to eight R570 homologous sequences already published. We use high
qualities paired-ends libraries produced by Illumina HiSeq 2000 sequencing platform. The reads
were aligned against eight R570 BACs (Bacterial Artificial Chromosome) sequences stored in
NCBI using Bowtie2. We used MaSuRCA to assemble the aligned reads de novo, and the
consensus sequences were obtained with SAMtools mpileup option. The transposable elements
were identified using RepeatMasker and the gene regions were annotated with Blastx against the
GenBank non-redundant protein database. After that, the consensus sequences were aligned with
the matching reference (R570) using ClustalW in Mega software, to look for the percentage of
mismatches and conserved sites between them. We obtained the number of scaffolds bigger than 1
kb ranging from 607 to 2,884, and the longest scaffold had near 21 kb. The consensus sequence
length ranged from 81 to 142 kb, and the recovery rate relative to the reference ranged from 82%
to 97%. The sequences amounted 1 Mb of RB867515 cultivar genome. We identified 5,145
repeated elements, which 4,662 were microsatellite and 460 were transposable elements, amounted
225 kb of repeated sequences. Among the mobile elements, the retrotransposons comprises 15% of
nucleotide composition, ranging from 8% to 29% among BACs. The 134 genes identified on the
eight BAC consensus sequences comprised a total of 243 kb, resulting in a density of one gene per
7.2 kb. The average number of genes per BAC was 16, with an average gene length of 1,841 bp.
The percentage of mismatches between the RB867515 and R570 BACs ranged from 0.27% to
1.32%. The sugarcane BACs correspond to homeologous genomic regions, with this alignment we
can suggest high divergence inside an homeologous group. / A cana-de-açúcar é reconhecida como uma das mais importante culturas do mundo, pela utilização
dos seus subprodutos. O genoma da cana-de-açúcar é um dos mais complexos entre as plantas
cultivadas, com aproximadamente 10 Gb. Seu genoma completo ainda não foi sequenciado, mas o
surgimento e a popularização de novas ferramentas de análise genômica possibilitaram estudos
refinados sobre essa cultura. Com o grande volume de informações que é possível gerar, a
demanda atual é a produção ferramentas eficientes para o processamento dos dados. Foi realizado
um assembly e anotação de uma região do genoma da cultivar RB867515 correspondente às
sequências de 8 BACs da cultivar R570. As regiões correspondentes foram obtidas por
alinhamento usando Bowtie2 com reads de bibliotecas paired-ends produzidos por sequenciador
automático de nova geração e montados de novo utilizando MaSuRCA. Os scaffolds foram
alinhados às sequência de referência usando BWA-SW, e as sequências consenso foram obtidas
pela opção mplieup do SAMtools. Reads de cDNA de cinco tecidos vegetais, provenientes de 30
genótipos de cana-de-açúcar obtidos pela estratégia RNA-seq, foram mapeados nas sequências
consenso a fim de identificar as regiões gênicas, que foram anotadas utilizando Blastx contra o
banco de proteínas não redundante no GenBank. As regiões repetitivas foram determinadas pelo
RepeatMasker e os microssatélites pelo IMEX. Para a comparação entre as sequências das duas
cultivares, foi realizado uma alinhamento das sequências correspondentes nos dois genomas
utilizando ClustalW no software Mega. O assembly das oito regiões, gerou de 607 à 2884 scaffolds
maiores que 1 kb, com o maior scaffold chegando a 21 kb. As sequências consenso variam de 81 a
142 kb de tamanho, representando uma taxa de recuperação em relação à referência de 82% a 97%.
O tamanho total das sequências montadas somou quase 1 Mb do genoma da cultivar de cana-deaçúcar.
Em relação à anotação, foram identificados 5145 elementos genéticos repetitivos, em que
4662 são microssatélites e 460 são transposons, totalizando 225 kb em sequências repetidas ao
longo dos BACs. Dentro do grupo dos elementos genéticos móveis os retrotransposons são
maioria, com 15% da composição nucleotídica, variando de 8% a 29% entre os BACs. Foram
identificados 134 genes nas oito sequências de cana-de-açúcar analisadas, totalizando 243 kb. O
número de genes por BAC variou de 11 a 26, com uma média de 16 genes por BAC. Os genes
encontrados apresentaram tamanho médio de 1841 pb, variando de 443 (BAC1) à 6316 pb
(BAC3). A densidade de genes média foi de 1 gene por 7,2 kb. A porcentagem de mismatches
entres as sequências dos BACs de RB867515 variou de 0,27% a 1,32%. Os BACs de cana-deaçúcar
correspondem a regiões genômicas homeólogas, com o alinhamento realizado com as duas
cultivares pode-se sugerir que existe alta divergência dentro do grupo de homeologia.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.bc.ufg.br:tede/7166
Date25 September 2014
CreatorsSouza, Isabela Pavanelli de
ContributorsCoelho, Alexandre Siqueira Guedes, Coelho, Alexandre Siqueira Guedes, Novaes, Evandro, Carneiro, Monalisa Sampaio
PublisherUniversidade Federal de Goiás, Programa de Pós-graduação em Genética e Melhoramento de Plantas (EAEA), UFG, Brasil, Escola de Agronomia e Engenharia de Alimentos - EAEA (RG)
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFG, instname:Universidade Federal de Goiás, instacron:UFG
Rightshttp://creativecommons.org/licenses/by-nc-nd/4.0/, info:eu-repo/semantics/openAccess
Relation-3325099404361873119, 600, 600, 600, 600, 600, 4500684695727928426, -7397920248419280716, -8370082027677193632, 2442915598251853972

Page generated in 0.0022 seconds