• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Tamanho, montagem de novo e anotação do genoma de Dipteryx alata (Leguminosae) / Size, de novo assembly and annotation of the genome of Dipteryx alata (Leguminosae)

Taquary, Adriana Maria Antunes 24 April 2017 (has links)
Submitted by JÚLIO HEBER SILVA (julioheber@yahoo.com.br) on 2017-05-09T19:16:43Z No. of bitstreams: 2 Tese - Adriana Maria Antunes Taquary - 2017.pdf: 3216713 bytes, checksum: caeaa4ba73b31eadb6f74040c4bb9b92 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-05-10T13:22:31Z (GMT) No. of bitstreams: 2 Tese - Adriana Maria Antunes Taquary - 2017.pdf: 3216713 bytes, checksum: caeaa4ba73b31eadb6f74040c4bb9b92 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-05-10T13:22:31Z (GMT). No. of bitstreams: 2 Tese - Adriana Maria Antunes Taquary - 2017.pdf: 3216713 bytes, checksum: caeaa4ba73b31eadb6f74040c4bb9b92 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-04-24 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Fundação de Amparo à Pesquisa do Estado de Goiás - FAPEG / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / In recent years there has been a rapid increase in the availability and quality of sequencing data and with this an explosion of projects of sequencing of the genomes of plants occurred. In this scenario, genomic analyzes have been characterized as efficient to generate genetic information on a large scale, including for non-model species. Dipteryx alata is a non-model tree species endemic to the Cerrado biome belonging to the Leguminosae family. The objectives of this work were to estimate the number of chromosomes and the size of the genome of D. alata, and also assemble and annotate sequences of the genomes organelles and nuclear of the species using Illumina sequencing data. The size of the genome of D. alata was estimated as 1C = 0.825 pg, which corresponds to a haploid genome of 807.2 MB with 2n = 16 chromosomes. Were assembled 275,709 nuclear genomic sequences with N50 equal to 1598, which corresponds to 355MB and 44% of the whole genome. In the nuclear sequences, 21,981 microsatellite regions were annotated, of which 49.3% had dinucleotide motifs, 42.7% trinucleotide motifs and 4% tetranucleotide motifs. Transposable elements (TEs) were found in 39.29% of the sequences analyzed, corresponding to 421,701 TEs. LTR retrotransposons (gypsy and copy) were the most abundant TEs in nuclear sequences. Were annotated 1,431 RNA genes non-translated into proteins, being 176 rRNAs, 189 tRNAs, 477 snRNAs, 8 snoRNAs, 466 miRNAs and 115 lncRNAs. Were annotated also 62,200 protein coding genes with an average size of 1,156 bp. The estimated number of mRNAs transcribed by the set of annotated nuclear genes was 160,450, of which 131,228 showed significant similarity with known sequences and 84,793 were classified functionally in the Gene Ontology terms. A total of 736,787 SNPs and 90,803 InDels were discovered in the nuclear sequences. A mean of 1 SNP was identified for each 189 bp of the genome and the ratio between the transition (Ts) and transversion (Tv) mutations was 1.58. A percentage of 46.5% of the SNPs occurs in the genic context and the effects of the SNPs were annotated mainly in exons and intergenic regions. Were assembled 110 KB of chloroplastid sequences with N50 of 2,384 bp and 327 KB of mitochondrial sequences with N50 of 1,784 bp. Were annotated genes of 3 rRNA, 13 tRNA, 6 miRNA and 20 lncRNA for the chloroplast and genes of 4 rRNA, 26 tRNA, 7 miRNA and 54 lncRNA for the mitochondria. For the chloroplast were predicted 20 protein coding genes with a mean size of 2,374 bp and for mitochondria were predicted 176 genes with a mean size of 1,279 bp. The estimated number of mRNAs transcribed by this gene set was 63 and 525 for chloroplast and mitochondria respectively. Were annotated 39 microsatellite regions and 4 TEs in the chloroplastid sequences and 158 microsatellite regions and 26 TEs in the mitochondrial sequences. This work, which can be considered one of the first genomic studies for Cerrado species, represents a great advance in the knowledge on the structure and organization of the D. alata genome. The obtained results open the way for further genetic and genomic investigation for the species. / Nos últimos anos houve um rápido aumento na disponibilidade e qualidade dos dados de sequenciamento e com isso ocorreu uma explosão de projetos de sequenciamento dos genomas de plantas. Nesse cenário, as análises genômicas vêm sendo caracterizadas como eficientes para gerar informações genéticas em larga escala, inclusive para espécies não modelos. Dipteryx alata é uma espécie de árvore não modelo endêmica do bioma Cerrado pertencente à família Leguminosae. Os objetivos deste trabalho foram estimar o número de cromossomos e o tamanho do genoma de D. alata, e também montar e anotar sequências dos genomas organelares e nuclear da espécie usando dados de sequenciamento Illumina. O tamanho do genoma de D. alata foi estimado como 1C = 0.825 pg, o que corresponde a um genoma haplóide de 807.2 MB com 2n=16 cromossomos. Foram montadas 275.709 sequências genômicas nucleares com N50 igual a 1598, o que corresponde a 355MB e 44% do genoma inteiro. Nas sequências nucleares foram anotados 21.981 regiões microssatélites, das quais 49,3% possuem motivos dinucleotídeos, 42,7% trinucleotídeo e 4% tetranucleotídeo. Elementos transponíveis (TEs) foram encontrados em 39,29% das sequências analisadas, o que corresponde a 421.701 TEs. Os retrotransposons LTR (gypsy e copia) foram os TEs mais abundantes nas sequências nucleares. Foram anotados 1.431 genes de RNAs não traduzidos em proteínas, sendo 176 rRNAs, 189 tRNAs, 477 snRNAs, 8 snoRNAs, 466 miRNAs e 115 lncRNAs. Foram anotados também 62.200 genes codificadores de proteínas com tamanho médio de 1.156 pb. O número estimado de mRNAs transcritos pelo conjunto de genes nucleares anotados foi igual a 160.450, dos quais 131.228 apresentaram similaridade significativa com sequências já conhecidas e 84.793 foram classificadas funcionalmente nos termos do Gene Ontology. Um total de 736.787 SNPs e 90.803 InDels foram descobertos nas sequências nucleares. Foi identificada uma média de 1 SNP a cada 189 pb do genoma e a razão entre as mutações de transição (Ts) e transversão (Tv) foi de 1,58. Uma porcentagem de 46,5% dos SNPs ocorreu em contexto gênico e os efeitos dos SNPs foram anotados principalmente em éxons e regiões intergênicas. Foram montados 110 KB de sequências cloroplastidiais com N50 de 2.384 pb e 327 KB de sequências mitocondriais com N50 de 1.784 pb. Foram anotados genes de 3 rRNA, 13 tRNA, 6 miRNA e 20 lncRNA para o cloroplasto e genes de 4 rRNA, 26 tRNA, 7 miRNA e 54 lncRNA para a mitocôndria. Para o cloroplasto foram preditos 20 genes codificantes de proteínas com tamanho médio de 2.374 pb e para a mitocôndria foram preditos 176 genes com tamanho médio de 1.279 pb. O número estimado de mRNAs transcritos por esse conjunto de genes foi igual a 63 e 525 para cloroplasto e mitocôndria, respectivamente. Foram anotados também 39 regiões microssatélites e 4 TEs nas sequências cloroplastidiais e 158 regiões microssatélites e 26 TEs nas sequências mitocondriais. Este trabalho, que pode ser considerado um dos primeiros estudos genômicos para espécies do Cerrado, representa um grande avanço nos conhecimentos sobre a estrutura e a organização do genoma de D. alata. Os resultados obtidos abrem caminho para novas investigações genéticas e genômicas para a espécie.

Page generated in 0.0574 seconds