De par sa taille (17 Gb), la complexité de son génome (allohexaploïde) ainsi que la forte proportion d’éléments répétés (>80%), l’étude du génome de blé tendre est une tâche particulièrement complexe et s’est souvent retrouvée confrontée aux limites technologies. Grâce une approche de tri de chromosomes, le chromosome 3B (995 Mb) a pu être isolé et séquencé. Ces données ont permis la construction d’une pseudomolécule. Mes travaux de thèse se sont basés sur des données de transcriptomique produites avec une approche RNA-Seq, afin d’investiguer l’impact de la taille de ce chromosome sur l’organisation de l’espace génique. L’annotation du chromosome 3B a permis de mettre en évidence : 5 326 gènes et 1 938 pseudogènes. L’analyse des librairies RNA-Seq pour 15 conditions de développement a permis de mettre en évidence l’expression de 71 % des gènes annotés, ainsi que 3 692 régions nouvellement transcrites (NTR). Nous avons aussi pu détecter des transcrits alternatifs pour 61% des gènes exprimés (en moyenne 6 isoformes). Nous avons donc pu mettre en évidence une structuration de l’espace génique pour le chromosome 3B. En effet, la transcription est répartie sur tout le chromosome, cependant les gènes sont organisés selon un gradient de densité croissant sur l’axe centromère-télomère. En nous basant sur le profil des données de recombinaison, nous avons divisé le chromosome en 3 régions : R1, R2 et R3. La région R2 correspondant à la région centrale du chromosome (647 Mb) où le taux de recombinaison est très faible voir absent. Les régions R1 (58 Mb) et R3 (69 Mb) correspondent respectivement aux parties distales du bras court et du bras long du chromosome, où le taux de recombinaison est le plus fort. Ces trois régions diffèrent par leur niveau et leur spécificité d'expression, ainsi que par leur structure génique (nombre d'exons, taille des introns …). En effet, les gènes ayant une expression tissu-spécifique, ainsi qu’un faible nombre de transcrits alternatifs sont retrouvés dans les régions R1 et R3. Deux modèles peuvent expliquer le lien observé entre la structure des gènes et leur niveau/spécificité d’expression : le modèle de la sélection pour l’économie et le modèle dessin génomique. En conclusion, ce travail a montré et ce, pour la première fois à l’échelle d’un chromosome entier de blé, l’impact de la taille du chromosome sur l’organisation ; mettant en relation la structure des gènes, leur niveau d’expression, leur spécificité d’expression, ainsi que leur nature évolutive. L’assemblage ainsi que l’annotation de pseudomolécules des autres chromosomes permettra de mettre en évidence si cette structure est conservée. Afin de mieux comprendre les mécanismes cellulaires impliqués dans la régulation de l’expression des gènes, une étude du paysage épigénomique a été engagée. / Genome-wide studies of the bread wheat are a complicated task due to its large size (17 Gb), its allohexaploidy and its high content in repeat sequences (>80%). Using a chromosome-specific approach, the chromosome 3B (995 Mb) was successfully isolated and sequenced leading to the assembly of one pseudomolecule. The work presented in this thesis investigated the impact of the 3B chromosome size on the gene space organization. Production of transcriptomic data was achieved using RNA-Seq approach. The chromosome 3B was annotated and we predicted 7 264 features, including 5 326 full genes and 1 938 pseudogenes. We constructed RNA-Seq libraries for 15 developmental wheat conditions. Using this data we detected expression of 71.4% of the predictions, and 3 692 novel transcribed regions (NTR). We also detected alternative transcripts for 61% of the expressed genes, with 5.8 isoforms on average for one gene. Using these transcriptional data, we highlighted a partitioning of the chromosome 3B gene space. Indeed, transcription was found all along the chromosome, but genes were organized according to an increasing density gradient along the centromere-telomere axis. Based on recombination profile, we segmented the chromosome in 3 major regions: R1, R2 and R3. The region R2 was identified with low or no recombination rate corresponding to the centromeric and peri-centromeric regions (647 Mb). The regions R1 and R3 were associated with a higher recombination rate, both localized on the distal part of the short arm (58 Mb) and the long arm (69 Mb) respectively, where the recombination rate is higher. All three regions showed distinct level and specificity of gene expression as well as unique gene structure (variation size, exon number, intron size). Indeed, genes expressed in a specific condition and with a small number of alternatives transcripts were localized on regions R1 and R3. We showed that two evolutionary model could explain the link between gene structure and the level/specificity of expression : “selection for economy” and “genome design”. In conclusion, a transcriptomic studies was achieved along the 3B chromosome for the first time. This study demonstrated a relationship between gene characteristics (structure, expression level, expression specificity and evolution) and the chromosome 3B organization. Future pseudomolecule assemblies will help us to assess the structural organization of these chromosomes. In order to better understand the cellular mechanisms of gene expression, an epigenomic study of the 3B chromosome was started.
Identifer | oai:union.ndltd.org:theses.fr/2014CLF22504 |
Date | 30 October 2014 |
Creators | Pingault, Lise |
Contributors | Clermont-Ferrand 2, Paux, Etienne |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French, English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0017 seconds