Return to search

Développement d'outils bio-informatique pour l'étude de la transcription cryptique

Les expériences de séquençage à haut débit ont permis de démontrer que la transcription ne se limite pas aux régions codantes et qu’une grande partie du génome est transcrite en ARN non-codants (ARNnc). Parmi eux, les transcrits cryptiques sont initiés à l’intérieur des régions codantes. Des études faites chez la levure Saccharomyces cerevisiae, ont pu identifier plusieurs facteurs qui répriment la transcription cryptique. Un de ces facteurs est Spt6, une chaperonne d’histones requise pour le maintien d’un bon niveau de nucléosomes le long des gènes transcrits. Lorsque Spt6 est muté, on observe une déplétion des nucléosomes conduisant à l’activation des promoteurs cryptiques. Cependant, le mécanisme par lequel ces transcrits cryptiques sont régulés n’est pas encore clair.

Dans ce mémoire, nous présentons un travail dans lequel nous avons développé une méthode probabiliste dans le but de caractériser les transcrits cryptiques à partir de données de RNA-Seq. Cette méthode est basée sur une cumulation des données et permet de tenir compte des variations dans l’expression et dans la longueur des gènes, grâce à une étape de randomisation des données. Les résultats démontrent que notre méthode est au moins aussi efficace que les méthodes précédemment décrites dans la littérature et offre un bon compromis entre le taux de faux positifs et de faux négatifs. Enfin, le plus important est que cette méthode permet de prédire les régions génomiques où les transcrits cryptiques sont initiés.

Nous avons mis en évidence la présence de transcrits cryptiques sur les brins sens et antisens par rapport au gène. Nous avons également montré que les promoteurs cryptiques sens et antisens sont enrichis en motif TATA et que les transcrits cryptiques sont polyadénylés, ce qui suggère qu’ils peuvent être régulés par les mêmes mécanismes qui régulent les gènes. Alors que les transcrits cryptiques sur le brin sens se terminent à la même position que les gènes dont ils sont issus, les transcrits cryptiques sur le brin antisens terminent préférablement aux extrémités 3’ des gènes situés en amont. Nous proposons donc que les terminateurs chez S. cerevisiae ont évolué pour terminer la transcription de manière bidirectionnelle afin d’empêcher une transcription aberrante qui pourrait envahir les gènes voisins. / High throughout sequencing experiments have shown that transcription in not limited to coding regions and that most of the genome is transcribed into non-coding RNA (ncRNA). Among them, cryptic transcripts are aberrantly initiated from within the coding regions. Several studies in Saccharomyces cerevisiae have identified many factors that suppress cryptic transcription. One such factor is Spt6, a histone chaperone required for maintaining appropriate nucleosome levels on transcribed genes. In Spt6 mutant cells, nucleosomes are depleted, leading to activation of cryptic promoters. However, the mechanism by which these cryptic transcripts are regulated remains unclear.
In this thesis, we present the development of a probabilistic method for the characterization of cryptic transcripts from RNA-Seq data. The method is used to characterize cryptic transcription in spt6-1004 cells. The method is based on a cumulative distribution function, thus taking into account variations in gene expression and gene length thanks to a data randomization step. Results show that our method is at least as good as previously published methods and provides a good compromise between false positives and false negatives. Importantly, this method allows for the prediction of genomic regions where cryptic transcripts are initiated.
We have demonstrated the presence of cryptic transcripts running on the sense and antisense strands relative to genes. We also showed that, both sense and antisense cryptic promoters are enriched for TATA-like sequences and that cryptic transcripts are polyadenylated, suggesting that they may be regulated by the same mechanism that occurs on genes. While the cryptic transcripts on the sense strand terminate at the same position as the genes from which they are derived, cryptic transcripts on the antisense strand preferentially terminate at the 3’-end of upstream genes. We therefore propose that S. cerevisiae terminators have evolved to terminate transcription bidirectionally in order to prevent an aberrant transcription that could invade neighboring genes.

Identiferoai:union.ndltd.org:umontreal.ca/oai:papyrus.bib.umontreal.ca:1866/18644
Date08 1900
CreatorsUwimana, Nicole
ContributorsRobert, François
Source SetsUniversité de Montréal
LanguageFrench
Detected LanguageFrench
TypeThèse ou Mémoire numérique / Electronic Thesis or Dissertation

Page generated in 0.0021 seconds