Résumé : INTRODUCTION : Les protéines doivent se retrouver dans le bon compartiment cellulaire afin de pouvoir exercer leurs fonctions. Une fois synthétisées dans le cytoplasme, les protéines se déplacent à travers les différents compartiments cellulaires, guidés par des signaux de ciblage protéique. Des modifications post-traductionnelles jouent un rôle dans la régulation et le contrôle dynamique de la localisation des protéines. Des exemples dans la littérature indiquent que cette régulation existe également au niveau pré-traductionnel. Ce projet cherche à investiguer cette régulation pré-traductionnelle sur les motifs d’import et d’export nucléaires choisi comme signaux modèles. A l’aide de la bio-informatique, nous caractérisons cette régulation pré-traductionnelle, pour ensuite analyser de façon quantitative le niveau du contrôle de l’inclusion de ces motifs dans les transcrits en considérant des données de RNA-seq. MÉTHODE : Des données du transcriptome humain ont été regroupées dans une base de données locale MySQL. Une curation extensive de bases de données publiques a permis d’identifier les motifs d’import et d’export nucléaires, validés expérimentalement. Des scripts dans les langages Python et PHP ont été créés afin d’interroger la base de données et d’implémenter les algorithmes. Par la suite des ensembles de données de RNA-seq ont été analysés pour quantifier le niveau d’inclusion de ces motifs. RÉSULTATS : La majorité de ces motifs varie pour les gènes dont seulement certaines isoformes contiennent ce motif. Nous avons pu déterminer la distribution de la position des motifs chez l’humain, et caractériser quatre différents types de régulation pré-traductionnelles pour ces motifs. Ces catégories sont : les sites d’initiation et de terminaison différentiels de transcription /traduction, l’épissage (d’introns/d’exons) et le décalage du cadre de lecture. L’index d’inclusion du motif (MII) varie pour les gènes à travers différents tissus d’un même ensemble de données et varie également dans des tissus cancéreux. Certains gènes produisent des isoformes dont le MII est tissu-spécifique. CONCLUSION : La régulation pré-traductionnelle de l’inclusion de motifs de ciblage d’import et d’export nucléaires joue un rôle important sur la localisation de la protéine résultante. Les données de RNA-seq ont abouti à une analyse quantitative sur ces motifs dans différents tissus normaux et cancéreux. / Abstract : INTRODUCTION: Proteins have to be in the right compartment in order to perform their functions. Once synthesized in the cytosol, proteins are guided by sorting signals as they move through different subcellular compartments. Post-translational modifications play a role in the regulation and dynamic control of protein localization. Some examples in the literature show that this regulation also exist at the pre-translational level. The purpose of this research is to investigate this regulation on nuclear import and export motifs, chosen as model signals. Using bioinformatics, we characterize this pre-translational regulation then using RNA-seq data, perform a quantitative analysis on the level of motif inclusion among transcripts. METHODS: Data of the human transcriptome was put in MySQL in house. For this study, we used experimental data. Extensive manual curation was performed on nuclear import and export motifs that were experimentally validated and obtained from public databases. In order to interrogate the database and implement the algorithms, scripts in Python and PHP were used. RNA-seq data were used and analyzed in order to quantify the level of inclusion of these motifs. RESULTS: The majority of these motifs are only present in a subset of the coding isoforms of the genes. The position distribution of these motifs in the human proteome was determined. We characterized four different types of pre-translational regulation for alternative motifs. The categories a re: differential initiation and termination sites of transcription/translation, splicing (of introns/exons) and frameshift mutation. Genes have a motif inclusion index (MII) that varies among different types of tissues within the same dataset and varies as well in cancer tissues. Some genes produce isoforms with MII that are tissue-specific. CONCLUSION: Pre-translational regulation plays an important role in the inclusion of nuclear import and export motifs and the localization of proteins containing them. Quantitative analyses showing the behaviour of the motifs in different types of normal and cancer tissues were performed with RNA-seq data.
Identifer | oai:union.ndltd.org:usherbrooke.ca/oai:savoirs.usherbrooke.ca:11143/8377 |
Date | January 2016 |
Creators | Akpawu, Akuvi Kafui Anna |
Contributors | Scott, Michelle |
Publisher | Université de Sherbrooke |
Source Sets | Université de Sherbrooke |
Language | French |
Detected Language | French |
Type | Mémoire |
Rights | © Akuvi Akpawu |
Page generated in 0.0022 seconds