1 |
Evaluating the effect of disruptive genetic variations on secondary cell wall deposition in Populus trichocarpaPiot, Anthony 23 October 2023 (has links)
Le bois est un matériau renouvelable et une source d'énergie importante dont les caractéristiques physiques et chimiques sont largement définies durant sa formation et plus spécifiquement à l'étape de déposition de la paroi cellulaire secondaire (DPCS). Comprendre les déterminants moléculaires régissant la DPCS améliorera nos connaissances de ce processus biologique et les stratégies d'amélioration génétique du bois. Les études d'associations génétiques ont identifié de nombreux gènes impliqués dans l'étape de DPCS chez l'espèce modèle d'arbre Populus trichocarpa. Ces études n'ont pas permis d'expliquer la plupart de l'héritabilité observé pour des traits phénotypiques en utilisant seulement les variations génétiques communes. Les variations génétiques rares caractérisées par leurs faibles fréquences dans les populations sont prometteuses pour expliquer une plus grande part de l'héritabilité manquante, surtout les variants avec un effet perturbateur sur les produits géniques. Le premier chapitre de cette thèse examine la littérature scientifique sur les dernières innovations technologiques et méthodologiques basée sur la génomique qui sont utilisées pour étudier les aspects moléculaires de la formation du bois. Les avancées dans les technologies de séquençage et l'assemblage de nouveaux génomes végétaux ont permis d'élargir la gamme d'organismes disponible pour l'étude de la formation du bois. L'étude des ARN non codants et des interactions épigénétiques est devenue une partie importante de la recherche sur la régulation de l'expression des gènes impliqués dans la formation du bois. La génétique des systèmes couplée à la théorie des réseaux a été utilisée pour intégrer plusieurs couches de données moléculaires afin d'étudier la formation du bois en tant que processus biologique complexe. En termes d'amélioration du bois, la sélection basée sur la génomique a produit des résultats prometteurs par rapport aux approches de sélection traditionnelles. Les technologies de criblage à haut débit et le reséquençage rentable de génomes complets permettent désormais d'identifier les variants génétiques rares dans une population. Cependant, ces variants rares doivent être identifiées avec confiance car ils peuvent facilement être confondus avec des erreurs de séquençage. Dans le deuxième chapitre, le reséquençage de génomes entiers de P. trichocarpa a été utilisé pour identifier les petites variations génétiques rares et communes présentes chez un grand nombre d'individu. Les variations génétiques caractérisées par deux logiciels d'identification de variants ont été comparées et strictement filtrées en fonction de leur qualité. Nous avons trouvé une grande diversité génomique chez P. trichocarpa, avec 8,5 millions de petites variations génétiques. Fait important, 377 000 variations non-synonymes (5 % du total) ont été découvertes. L'importance de la diversité génomique et le potentiel des variations génétiques défectueuses rares pour expliquer une part importante de la variabilité phénotypique de P. trichocarpa sont mis en évidence. Les variations perturbatrices de l'ADN codant peuvent mener à des produits géniques défectueux et être utilisées en sélection moléculaire. Dans le troisième chapitre, 58 variations génétiques perturbatrices ont été identifiées dans les gènes de DPCS chez P. trichocarpa. Des données transcriptomiques ont ensuite été utilisées pour examiner les patrons d'expression de ces gènes. Une différence d'expression significative a été observée entre les individus avec et sans variants perturbateurs pour 13% des transcrits de gènes dans lesquels des variants perturbateurs ont été trouvés. Chez les individus hétérozygotes, l'expression spécifique de l'allèle correspondant aux variants perturbateurs et à l'allèle de référence était significativement différente pour la moitié de nos observations et variait significativement entre génotypes, clones et environnements. Le potentiel de deux variants perturbateurs dans deux gènes d'hémicellulose a été évalué pour l'amélioration du bois. Ces résultats révèlent une régulation complexe de l'expression des gènes de DPCS possédant des variations perturbatrices et soulignent l'importance des influences environnementales sur l'expression des transcrits. Cette thèse démontre l'importance de la conception des études génomiques pour l'identification des variants génétiques rares. La régulation complexe de l'expression des gènes de DPCS associée à la présence de variants perturbateurs a aussi été mise en évidence. Récemment, le domaine de la génomique du bois a connu une évolution vers une approche de plus en plus holistique pour déchiffrer la formation du bois en tant que processus biologique complexe. Les connaissances qui en résulteront amélioreront davantage nos connaissances sur les déterminants moléculaires de la formation du bois et renforceront l'efficacité des stratégies d'amélioration des arbres. / Wood is an important renewable material and energy source whose physical and chemical characteristics are mainly determined during its formation, and specifically the secondary cell wall deposition (SCWD) step. Understanding the molecular determinants of the SCWD process is thus important to improve knowledge of this biological process and wood improvement strategies. Genomics studies in the form of genetic association studies identified many genes involved in the SCWD step in the tree model species Populus trichocarpa but failed to explain most of the observed heritability in phenotypic traits using common genetic variation only. Rare genetic variants characterized by their low frequency in populations hold potential to explain more of the missing heritability, especially those variants with a disruptive effect on gene products. The first chapter of this thesis review the research literature on the latest genomics-based technological and methodological innovations used to study the molecular aspects of wood formation. Summary of these advancements highlight how breakthroughs in sequencing technologies and the availability of additional assembled and functionally annotated plant genomes have broadened the scope of organisms for investigating the distinct wood formation patterns among seed plants. The study of non-coding RNAs and epigenetic interactions has become an important part of the research on the expression regulation of genes implicated in wood formation. Systems genetics coupled with network graph theory have been used to integrate multiple layers of molecular data to study wood formation as a complex biological process. In terms of wood improvement, genomics-enabled breeding has produced similar or even better results compared to traditional selection approaches. High-throughput technologies and cost-efficient resequencing of complete genomes have enabled the identification of every genetic variation along genomes, and it is now possible to identify rare genetic variants in a population sample. Rare genetic variants, however, must be identified with high confidence, as they can easily be confounded with sequencing errors. In the second chapter, whole genome resequencing of Populus trichocarpa were used to identify rare and common small genetic variants across individual genomes. The genetic variations identified by two variant calling software were compared and filtered using strict quality criteria. Based on the variants identified by both variant callers, we found high genomic diversity in P. trichocarpa germplasm, with 8.5 million small genetic variants. Importantly, 377k non-synonymous variants (5% of the total) were uncovered. The importance of genomic diversity and the potential of rare defective genetic variants in explaining a significant portion of P. trichocarpa's phenotypic variability in association genetics are highlighted. Disruptive variants within coding DNA predictably leads to defective gene products and may be targets for molecular breeding. In the third chapter, 58 disruptive genetic variants were identified in P. trichcocarpa's SCWD genes, using the genetic variants recovered in Chapter 2. Two transcriptomic datasets were then used to examine the expression patterns of these genes. Transcript expression differed significantly between individuals with disruptive variants and those without in 13% of gene transcripts in which disruptive variants were found. In heterozygous individuals, the allele-specific expression of disruptive variants and the reference allele was significantly different in approximately half of our observations and varied significantly between genotypes, clonemates and environments. The potential of two disruptive variants in two hemicellulose genes, GUX and GT8D2, was also evaluated for wood improvement. Overall, these results show complex expression regulation of SCWD genes with disruptive variants and highlight the importance of environmental influences on transcript expression. This thesis demonstrates the importance of study design for the proper identification of rare genetic variants. In addition, the complex regulation of SCWD gene expression associated with the presence of disruptive variants have been highlighted. Over the past five years, the field of wood genomics has seen a shift to an increasingly holistic approach to help decipher wood formation as a complex biological process. The resulting knowledge will further improve our knowledge about the molecular determinants of wood formation and enhance the efficiency of tree breeding strategies.
|
Page generated in 0.1187 seconds