Tese (doutorado)—Universidade de Brasília, Departamento de Biologia Celular, 2013. / Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2013-06-24T11:20:19Z
No. of bitstreams: 1
2013_CesarDanielPetroli.pdf: 6307337 bytes, checksum: 650ed813622f95d1dfc5d7a15fa7fa9f (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2013-06-24T11:51:03Z (GMT) No. of bitstreams: 1
2013_CesarDanielPetroli.pdf: 6307337 bytes, checksum: 650ed813622f95d1dfc5d7a15fa7fa9f (MD5) / Made available in DSpace on 2013-06-24T11:51:04Z (GMT). No. of bitstreams: 1
2013_CesarDanielPetroli.pdf: 6307337 bytes, checksum: 650ed813622f95d1dfc5d7a15fa7fa9f (MD5) / Diversity Arrays Technology (DArT) fornece um sistema robusto, de alto rendimento e baixo custo para a identificação de milhares de polimorfismos na sequência do DNA de indivíduos. Apesar da extensa utilização desta plataforma de genotipagem para diversas espécies de plantas, pouco se conhece sobre os atributos dos marcadores DArT do ponto de vista do conteúdo das sequências e sua distribuição em genomas de plantas. Neste trabalho foram investigadas as propriedades genômicas das 7.680 sondas do microarranjo DArT desenvolvido para Eucalyptus, por meio do seu sequenciamento e mapeamento genético e físico no genoma de referência de Eucalyptus grandis. Em seguida, o mapa genético construído foi utilizado para o mapeamento de QTLs (Quantitative Trait Loci) para sete características quantitativas de crescimento e qualidade da madeira em Eucalyptus. Finalmente, para cada QTL identificado foi realizada uma análise preliminar do número de genes anotados na sequência do genoma de Eucalyptus incluídos no intervalo genômico correspondente. Um mapa consenso com 2.274 marcadores DArT ancorado a 210 microssatélites com uma média de distância entre marcadores consecutivos na ordem de sub-centimorgan e um mapa genético framework com 1.029 marcadores ordenados com maior suporte estatístico foram construídos. Ambos exibiram uma extensa colinearidade com a sequência do genoma quando mapeados fisicamente. O número de sequências únicas observadas para as sondas DArT foi consistente com o número de sequências DArT alinhadas em uma posição única no genoma de Euaclyptus. Com uma cobertura do 97% do genoma físico, estes marcadores demonstraram uma ampla e uniforme distribuição ao longo do genoma. Apenas 1,4 Mpb dos 85,4 Mpb das sequências de scaffolds ainda não ancorados no atual genoma de Eucalyptus foi capturado por 45 marcadores DArT geneticamente mapeados mas fisicamente não alinhados nos 11 pseudo-cromossomos de Eucalyptus, fornecendo evidência sobre a qualidade e a completude da montagem atual do genoma de Eucalyptus. A maioria das 89 sondas do microarranjo DArT que não mapearam fisicamente no genoma correspondem a sequências provavelmente ausentes em E. grandis, o que sugere um caráter pangenômico do microarranjo DArT de Eucalyptus. Uma sobreposição significativa foi encontrada entre o posicionamento dos marcadores DArT e o espaço gênico, com 69% das sondas DArT mapeando dentro de modelos gênicos preditos. Uma correlação significativa foi identificada entre o número de modelos gênicos preditos e o número total de sondas DArT encontradas em todo o genoma (índice de Spearman ρ = 0,682, ρ = 3,79e-18). O mapeamento de QTLs detectou 35 QTLs para as características avaliadas, sendo que vários deles sugestivos de sintenia em nível cromossômico com QTLs detectados em estudos anteriores. Um total de 8.036 modelos gênicos preditos foi observado nos intervalos genômicos compreendidos pelos marcadores flanqueantes aos 18 QTLs mapeados no parental materno e 6.678 nos intervalos dos 17 QTLs identificados no parental paterno. Centenas desses genes poderiam ser sugeridos tentativamente como genes candidatos para as características fenotípicas avaliadas, cuja validação demandaria um esforço considerável. Em conclusão, as propriedades genômicas dos marcadores DArT levantadas neste estudo são particularmente interessantes para os investigadores que trabalham com culturas as quais já contam com microarranjos DArT mas para as quais não existe ainda um genoma de referência que permita uma caracterização detalhada. Estas propriedades são potencialmente úteis para a realização de estudos filogenéticos, de genética de populações e predição de fenótipos via seleção genômica, explorando a proximidade destes marcadores a genes. _______________________________________________________________________________________ ABSTRACT / Diversity Arrays Technology (DArT) provides a robust, high throughput, costeffective method to query thousands of sequence polymorphisms in a single assay. Despite the extensive use of this genotyping platform for numerous plant species, little is known regarding the sequence attributes and genome-wide distribution of DArT markers. We investigated the genomic properties of the 7,680 DArT marker probes of a Eucalyptus array, by sequencing them, constructing a high density linkage map and carrying out detailed physical mapping analyses to the Eucalyptus grandis reference genome sequence. The genetic map was used for QTL (Quantitative trait loci) mapping for seven complex growth and wood quality traits in Eucalyptus. Finally, for each QTL we preliminarily assessed the number of annotated gene models in the Eucalyptus genome found in its corresponding genomic interval delimited by flanking markers. A consensus linkage map with 2,274 DArT markers anchored to 210 microsatellites and a framework map, with 1,029 markers ordered with high support, displayed extensive collinearity with the genome sequence. Only 1.4 Mbp of the 75 Mbp of still unplaced scaffold sequence was captured by 45 linkage mapped but physically unaligned markers to the 11 Eucalyptus pseudochromosomes, providing compelling evidence for the quality and completeness of the current Eucalyptus genome assembly. A highly significant correspondence was found between the locations of DArT markers and predicted gene models, while most of the 89 DArT probes unaligned to the genome correspond to sequences likely absent in E. grandis, consistent with the pan-genomic feature of this multi-Eucalyptus species DArT array. DArT markers preferentially target the gene space and display a largely homogeneous distribution across the genome, thereby providing superb coverage for mapping and genome-wide applications in breeding and diversity studies. QTL mapping detected 35 QTLs, several of them syntenic to QTLs in previous studies. A total of 8,036 annotated gene models were found within the genomic interval comprised by the 18 QTLs detected in the maternal parent and 6,678 in the 17 QTLs identified in the paternal parent. Hundreds of such predicted genes could be tentatively suggested as candidates involved in trait variation, whose testing and validation would require a gigantic effort. In conclusion, the comprehensive linkage-to-physical mapping analyses reported herein, provide novel data regarding the genomic attributes of DArT markers in plant genomes in general and for Eucalyptus in particular. These results should be valuable to other species for which DArT arrays are available but not yet reference genomes. Based on the genomic characterization of the DArT probe sequences reported, phylogenies, population genetic surveys and phenotype prediction by genomic selection can now be further explored according to the gene proximity or gene content of particular markers sets.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/13392 |
Date | 26 April 2013 |
Creators | Petroli, César Daniel |
Contributors | Grattapaglia, Dario |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB |
Rights | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess |
Page generated in 0.0027 seconds