21 |
Etude des éléments régulateurs de l'expression des gènes chez l'humain / Study of regulatory elements on gene expression in humansBessiere, Chloé 27 November 2018 (has links)
L'expression des gènes est étroitement régulée par différentes régions régulatrices afin d'assurer une grande variété de types cellulaires et de fonctions. Identifier ces régions régulatrices actives, leurs caractéristiques et comprendre comment elles interagissent entre elles dans chaque type cellulaire est un enjeu majeur. Cette connaissance permettrait notamment de mieux comprendre l'impact des variants génomiques très souvent localisés dans les régions non-codantes. Par ailleurs, le développement de cancers et autres maladies est lié à des dérégulations des contrôles de l'expression des gènes. Pour pouvoir envisager des traitements ciblés et tendre vers une médecine de précision, il est important de comprendre comment toute cette machinerie est orchestrée.Plusieurs approches ont été développées pour répondre à cette question, la plupart basées sur des données expérimentales de modification d'histones, méthylation et facteurs de transcription (TFs). Cependant, ces données sont limitées à des échantillons spécifiques et ne peuvent pas être générées pour tous les régulateurs et tous les patients. Mes travaux de thèse ont porté, dans une première partie, sur la modélisation de l'expression des gènes uniquement à partir de l'information contenue dans la séquence ADN. Nous avons utilisé un modèle linéaire avec sélection de variables, équivalent en terme de performances à des méthodes non paramétriques et simple à interpréter. Ce modèle m'a permis de comparer plusieurs types de variables basées sur la séquence ADN, comme les motifs de fixation des TFs et la composition nucléotidique. Ces variables sont déterminées pour différentes régions du gène afin d'évaluer leur pouvoir régulateur et leur contribution. Les introns seuls, dont la composition nucléotidique reflète celle de l'environnement du gène, expliquent une part importante de la variation de l'expression des gènes. De plus, nous avons démontré que les domaines topologiques (TADs), dans lesquels les interactions sont favorisées, partagent une composition génomique similaire. Notre modèle de prédiction nous permet vraisemblablement de capturer, pour chaque individu, la composition des TADs actifs.Dans un second temps de mon travail, je me suis intéressée aux régulations pouvant survenir dans les introns. Le consortium international FANTOM a fourni un des atlas de sites de départ de la transcription (TSSs) les plus importants à ce jour et nous avons noté que la majorité d'entre eux sont détectés dans les régions non-codantes, notamment les introns. Nous avons donc entrepris un travail visant à explorer ces TSS introniques. Pour déterminer si ces TSSs sont fonctionnels, je me suis intéressée à la recherche de potentiels motifs régulateurs autour de ces signaux de transcription. Une fraction de ces signaux sont localisés 2 bases en aval d'une répétition de Thymidines (T). Des évidences biochimiques et génétiques suggèrent qu'au moins une partie de ces signaux correspondent à de longs ARNs non-codants sens-introniques exprimés de manière tissu-spécifique. Il semblerait également que la longueur des répétitions de Ts ait une influence sur la présence d'un signal de transcription au niveau de ces loci et, indirectement, sur l'expression du gène hôte. Ces observations offrent une possible base moléculaire à l'effet de ces courtes répétitions en tandem de T. / Genome expression is tightly controlled by different regulatory regions to provide a wide variety of cell types and functions. Identifying these regulatory regions, their characteristics and understand how they interact with each other in a tissue-specific manner is prime importance. This knowledge should help better understand the impact of genomic variants often located in non-coding regions. Besides, cancer development is invariably linked to deregulation of gene expression controls. To pave the way for targeted treatments and precision medicine, it is important to understand how all this machinery is orchestrated.To answer this question, several approaches were developed, most of them based on experimental data of histone modification, methylation and transcription factors (TFs). However, these data are limited to specific samples and cannot be generated for all the regulators and all the patients. First, my thesis research aimed at modeling gene expression based on DNA sequence only. We used a linear model with variable selection, equivalent in term of performances with non-parametric methods and easy to interpret. This model allowed me to compare several types of variables based on the DNA sequence, as TFs binding motifs and nucleotide composition. These variables are computed for various gene regions to estimate their regulatory power and contribution. Strikingly, introns, for which nucleotide composition reflects gene environment, appear to explain an important part of gene expression variation. Furthermore, we demonstrated that the topological domains (TADs), in which interactions are favored, share similar genomic compositions. Our prediction model presumably captures, for every individual, the composition of active TADs.A second aspect of my work studied the regulations occurring in introns. The international FANTOM consortium provided one of the most important transcription start sites (TSSs) atlas and we noticed that the majority of these TSSs are detected into non-coding regions, in particular introns. We thus investigated these intronic TSSs. To determine if these TSSs are functional, we searched for new potential regulatory motifs at the vicinity of these transcription signals. We found that a fraction of them is located 2 bases downstream of a repetition of Ts. Biochemical and genetic evidences suggest that at least part of these signals correspond to sense-intronic long non-coding RNAs, which are expressed in a tissue specific manner. The length of the T repetition also appears to govern the presence of a transcription signal at these loci and indirectly impact on host gene expression. These findings provide one possible molecular explanation for the effect of these short tandem repeats of Ts.
|
22 |
Role of general regulatory factors in the control of gene expression and transcription fidelity / Rôle des facteurs de transcription dans le contrôle de l'expression des gènes et de la fidélité de la transcriptionChallal, Drice 02 July 2019 (has links)
Ces dernières décennies ont été marquées par la découverte de la transcription dite « cachée » ou « pervasive ». Il a été en effet montré que la majeure partie du génome des eucaryotes est transcrite, donnant naissance à la formation de nombreux ARNs non-codants. La délimitation des unités de transcription apparait essentielle dans le contrôle de l’expression des gènes mais également dans le maintien de l’intégrité des processus associés à l’ADN en limitant notamment l’apparition de conflits avec la transcription. Dans ce contexte, l’initiation et la terminaison de la transcription représentent des étapes clés dans le partitionnement du génome et le métabolisme des ARNs. Nous avons montré que certains facteurs de transcription, appelés GRFs (General Regulatory Factors) chez la levure S. cerevisiae, jouent un rôle important dans le contrôle de la transcription pervasive à la fois au niveau de l’initiation mais également de la terminaison de la transcription et sont également requis pour assurer la fidélité de la transcription des gènes codant les ARN messagers. Nous avons prouvé que les GRFs liés au niveau des régions promotrices sont capables d’induire la terminaison de la transcription en bloquant physiquement la progression d’ARN polymérases issues de la translecture des terminateurs situés en amont. D’après nos études, cette voie de terminaison appelée « roadblock » est très répandue à l’échelle du génome et joue un rôle important dans la protection des promoteurs contre l’interférence transcriptionnelle. Nous avons également découvert que les GRFs limitent la transcription pervasive en obstruant les sites d’initiations ectopiques situés à proximité de leur site de fixation sur l’ADN. Ces facteurs sont aussi impliqués dans le contrôle de l’expression des gènes codants en favorisant l’utilisation de sites d’initiations les plus appropriés, c’est-à-dire, permettant la synthèse d’ARNs ayant un fort potentiel codant. Le rôle des GRFs dans le contrôle de l’initiation apparait intimement lié à leur capacité à correctement positionner les nucléosomes au niveau des promoteurs en collaboration avec les facteurs de remodelage de la chromatine. / The last decades have been marked by the discovery of pervasive transcription. Indeed, many studies have shown that transcription by RNA polymerase II is not restricted to annotated regions but is widespread in eukaryotic genomes, leading to the production of a plethora of non-coding RNAs. Precise delimitation of transcriptional units appears to be essential to ensure robust fidelity of gene expression and to maintain the integrity of DNA-associated events by preventing the occurrence of conflicts with transcription. In this respect, accurate transcription initiation and termination represent crucial mechanisms to partition the genome and define the correct processing of RNA molecules. Here, we show that yeast general regulatory factors (GRFs), a class of highly expressed transcription regulators, control pervasive transcription at the level of initiation and termination and are also involved in the fidelity of initiation of mRNA-coding genes. We demonstrate that GRFs bound at promoter regions can elicit transcription termination by physically impeding the progression of polymerases mainly deriving from readthrough transcription at upstream canonical termination sites. We provide evidence that this termination pathway named roadblock is widespread throughout the yeast genome and protects promoter regions from transcriptional interference. Furthermore, we establish that the presence of general regulatory factors also limits pervasive transcription at the level of initiation, notably by occluding spurious transcription start sites present in the vicinity of their binding sites. We also unveil the importance of these factors in promoting correct transcription start site selection at mRNA-coding genes thus favouring the synthesis of transcripts with an appropriate coding potential. Finally, we determine that the role of GRFs in controlling proper initiation is intimately linked to their ability to correctly position nucleosomes in promoters, a role that occurs independently from but in cooperation with chromatin remodelers.
|
23 |
Post-transcriptional regulation of porin expression in Escherichia coli and its impact on antibiotic resistance / Régulées de manière post-transcriptionnelle de l'expression de la porine chez Escherichia coli et son impact sur la résistance aux antibiotiquesDam, Sushovan 15 November 2018 (has links)
Chez les bactéries à Gram-négatif, l’imperméabilité de la membrane externe est un facteur majeur contribuant au développement de la résistance. Chez Escherichia coli, les porines OmpF et OmpC sont des protéines de la membrane externe qui forment des canaux pour la diffusion de petites molécules hydrophiles tels que les antibiotiques. L’expression des porines est soumise à une régulation fine, et des petits ARN non-codants (sRNAs, small RNAs) jouent un rôle important au niveau post-transcriptionnel. Dans ce cadre, et en utilisant E. coli comme bactérie modèle, les objectifs de mon travail de thèse étaient : (1) de caractériser la régulation du sRNA MicC et la co-régulation putative de la porine quiescente OmpN; (2) d’examiner l'effet global de MicC sur le transcriptome; (3) d’analyser l'impact de l'expression de MicC sur la sensibilité aux antibiotiques. Les résultats obtenus montrent l’induction de MicC en présence d'antibiotiques de la famille des β-lactamines, ou en l’absence du facteur sigma de réponse au stress de l’enveloppe sigmaE. Ces mêmes conditions activent aussi l'activité d'une fusion ompN-lacZ, indiquant une régulation transcriptionnelle commune de micC et ompN. Etant donnée la conservation de MicC chez les entérobactéries, nous avons effectué une étude par RNASeq pour déterminer l'impact de la surexpression de MicC sur le transcriptome d’E. coli et identifié 60 ARNm régulés par MicC en plus de sa cible initiale ompC. L'identification des spectres cibles globaux des sRNAs est importante pour comprendre leur importance dans la physiologie bactérienne, ici celui de MicC dans la résistance aux antibiotiques. / A major factor contributing to antimicrobial resistance is the inability of antibiotics to penetrate the bacterial outer membrane to reach their target. In Escherichia coli, the two abundantly expressed porins OmpF and OmpC form channels for diffusion of small hydrophilic molecules including antibiotics. The expression of porins is under complex regulation and the small regulatory RNAs (sRNAs) fine tune the porin expression level at post-transcriptional level. MicF and MicC are the two major sRNAs that negatively regulate expression of OmpF and OmpC, respectively. Interestingly, these two sRNAs are encoded next to porin gene, i.e. micF-ompC and micC-ompN, suggesting a dual regulation. Our goals in this work were: (1) to characterize the regulation of the sRNA MicC and the putative co-regulation of the quiescent porin OmpN in E. coli; (2) to examine the global effect of MicC on the E. coli transcriptome; (3) to analyze the impact of MicC expression on antibiotic susceptibility. Our work shows that the expression of micC was increased in the presence of carbapenems and cephalosporins and in an rpoE depleted mutant. The same conditions enhanced the expression of OmpN, suggesting a dual regulation of micC and ompN. We also performed RNA sequencing to determine the impact of MicC overexpression on E. coli transcriptome. This identified 60 mRNA targets negatively regulated by MicC apart from its original target. Identification of the global target spectra of MicC is of importance to understand its importance on the overall bacterial physiology, and more specifically on AMR.
|
24 |
Algorithmes de prédiction et de recherche de multi-structures d'ARNSaffarian, Azadeh 16 November 2011 (has links) (PDF)
L'ARN (acide ribonucléique) est une molécule ubiquitaire qui joue plusieurs rôles fondamentaux au sein de la cellule: synthèse des protéines avec les ARN messagers, activité catalytique ou implicationdans la régulation, les ARN non-codants. Les nouvelles technologies de séquençage à haut-débit permettent de produire des milliards de séquences à moindre coût, posant de manière cruciale la question de l'analyse de ces données. L'objectif de cette thèse est de définir de nouvelles méthodes computationnelles pour aider à l'analyse de ces séquences dans le cas des ARN non-codants. Dans cette perspective, la "structure secondaire" d'un ARN, formée par l'ensemble des appariements entrebases, délivre des informations utiles pour étudier la fonction de l'ARN. Notre travail se concentre plus particulièrement sur l'ensemble des structures potentielles que peut adopter une séquence d'ARN donnée, ensemble que nous appelons "multi-structure". Nous apportons deux contributions: un algorithme pour générer systématiquement toutes les structures localement optimales composantune multi-structure, et un algorithme basé sur la recherche d'unemulti-structure pour identifier un ARN non-codant dans une séquence génomique. Ces résultats ont été mis en oeuvre dans deux logiciels, Alterna et Regliss, appliqués avec succès à des ensembles de test.
|
25 |
Découverte de nouvelles protéines impliquées dans la spermatogenèse chez le rat / Discovery of novel proteins involved in spermatogenesis in the ratChocu, Sophie 30 September 2014 (has links)
La spermatogenèse chez les mammifères est une fonction biologique complexe incluant des processus de prolifération cellulaire, de méiose et de différenciation uniques visant à la production des gamètes mâles au sein du testicule. Si l’épithélium séminifère est bien décrit sur le plan de son organisation et de la morphologie des cellules qui le composent, les processus par lesquels les cellules germinales diploïdes indifférenciées entrent en méiose pour donner ensuite des cellules haploïdes subissant par la suite de nombreuses transformations morphologiques, ne sont pas totalement décryptés. Ils reposent sur l’expression coordonnée et séquentielle de gènes dont les produits spécifiques de chaque stade de développement des cellules germinales sont essentiels aux étapes clés de la spermatogenèse. La transcriptomique depuis les années 1990 et la protéomique depuis les années 2000 ont contribué à l’amélioration de la connaissance de ces mécanismes. Une étude protéomique visant à caractériser par des approches systématiques et différentielles les protéomes des cellules de Sertoli et de la lignée germinale, et d’autre part une étude récente, réalisée dans notre unité, qui a permis de caractériser et de quantifier le transcriptome des cellules testiculaires isolées de rat en utilisant le séquençage de novo des transcrits (RNA-Seq), ont été à la base de mes travaux de thèse. Cette dernière étude a mis en évidence l’accumulation de longs ARNs non codants (lncRNAs) et de transcrits testiculaires non annotés (TUTs) aux stades méiotique et post- méiotique de la spermatogenèse chez le rat. Dans ce contexte, mon travail a consisté à valider le potentiel codant de nombreux gènes exprimés dans les cellules germinales par une approche dite PIT (Proteomics Informed by Transcriptomics) couplant protéomique Shotgun et RNA-Seq. Dans ce type d’approche, les séquences protéiques déduites des transcrits des différents types cellulaires, assemblés par RNA-Seq, sont intégrées dans une base personnalisée de séquences protéiques utilisée pour interroger les données de spectrométrie de masse obtenues à partir de protéines de cellules méiotiques et post-Méiotiques. L’approche PIT a permis de montrer que 69 TUTs ou lncRNA (correspondant à 44 loci) codent pour des protéines dans les cellules méiotiques et post méiotiques. L’expression post-Méiotique de deux nouveaux transcrits, l’un codant pour la protéine VAMP9, une protéine de la famille SNARE, et l’autre pour une nouvelle énolase T-ENOL a pu être confirmée. L’expression post-Méiotique de T-ENOL a été confirmée par immunohistochimie à l’aide d’un anticorps polyclonal produit contre la protéine recombinante. Cette approche nous a également permis d’identifier de nouvelles isoformes de protéines connues spécifiques de chaque stade de la spermatogenèse. Les cellules germinales et les cellules de Sertoli entretiennent le dialogue nécessaire au bon déroulement de la spermatogenèse. Une autre partie de mon travail a consisté à identifier des protéines membranaires des cellules germinales et des corps résiduels, susceptibles d’intervenir dans le dialogue entre les cellules de Sertoli et les cellules germinales, par une approche protéomique de quantification relative ICPL. Cette approche a permis d’établir une liste de 166 protéines différentiellement exprimées entre les spermatocytes pachytène, les spermatides rondes et les corps résiduels, qui sont susceptibles de jouer un rôle dans la spermiogénèse. Grâce aux annotations de le Gene Ontology, j’ai pu établir une liste de 8 protéines ayant un rôle supposé dans la transduction du signal, la reconnaissance cellulaire ou bien la différenciation. Par ailleurs, j’ai pu établir par protéomique Shotgun un premier protéome des cellules de Sertoli, des cellules germinales et des corps résiduels chez le rat. / Spermatogenesis in mammals is a complex biological function including cellular processes such as proliferation, meiosis and differentiation, aiming to the production of male gametes in the testis. If the seminiferous epithelium is well described in terms of organization and cellular morphology of cells that compose it, the processes by which undifferentiated diploid germ cells enter meiosis and give haploid cells that undergo many morphological transformations, are not fully decrypted. These processes rely on the coordinated and sequential expression of genes, including specific products for each stage of germ cell development These gene products are essential at each key stage of spermatogenesis. Transcriptomics since the 1990s, and proteomics since the 2000s have contributed to the improved. understanding of these mechanisms. A long term proteomic study aiming at characterizing the proteomes of Sertoli cells and germ cells, and a recent study that characterized and quantified the transcriptome of isolated rat testicular cells at high resolution using de novo sequencing of transcripts (RNA-Seq), have been the basis of my thesis work. The latter study showed the accumulation of long non-Coding RNAs (lncRNAs) and testicular unannotated transcripts (TUTs) at meiotic and post-Meiotic stages of spermatogenesis in the rat. In this context, my thesis work aimed at validating the coding potential of many genes expressed in germ cells using RNA-Seq combined with shotgun proteomics, a so-Called PIT (Proteomics Informed by transcriptomics) approach. In this approach, the protein sequences translated from the transcripts assembled by RNA-Seq in the different testicular cell types are integrated into a custom database of protein sequences used to query mass spectrometry data obtained from proteins of meiotic and post-Meiotic cells. The PIT approach showed that 69 TUTs or lncRNA (corresponding to 44 loci) code for proteins in meiotic cells and post meiotic cells, and we confirmed experimentally the meiotic and post-Meiotic expression for two new transcripts encoding for VAMP9, a protein of the SNARE family, and a new testicular enolase T-ENOL. The post-Meiotic expression of T-ENOL protein was confirmed by immunohistochemistry using a polyclonal antibody raised against the recombinant protein. This approach also allowed us to identify new isoforms of known proteins, specific to each stage of spermatogenesis. Germ cells and Sertoli cells maintain a dialogue which is necessary to the success of spermatogenesis and spermiogenesis. Another part of my work aimed at identifying membrane proteins, in germ cells and residual bodies, that may be involved in the dialogue between Sertoli cells and germ cells, using a ICPL relative quantification proteomic approach. The ICPL analysis enabled us to establish a list of 166 proteins whose expression is differential between pachytene spermatocytes, round spermatids and residual bodies. Their differential expression suggests that these proteins may play a role in spermiogenesis. Thanks to the Gene Ontology annotations, a list of 8 proteins with a putative role in signal transduction, cell recognition or differentiation, thus potentially involved in the dialogue between Sertoli and germ cells was drawn. In addition, I provided a first proteome of rat Sertoli cells, germ cells and residual bodies obtained by shotgun proteomics.
|
26 |
Étude fonctionnelle des sous-domaines de Pcf11 : rôle du 2nd NTD dans la terminaison de transcription des snoRNAs et des motifs liant le zinc dans les activités de maturation de l’extrémité 3’ des ARN messagers. / Functional analysis of Pcf11 sub-domains : role of the 2nd NTD in transcription termination of snoRNAs and zinc finger motifs in 3’-end processing of mRNAsGuéguéniat, Julia 03 December 2015 (has links)
Chez les eucaryotes, la maturation de l’extrémité 3’ des ARNs messagers a lieu lors de la transcription et regroupe deux étapes : le clivage endonucléolytique du transcrit au niveau d’un site spécifique et l’ajout d’une queue poly(A) sur le fragment en amont du site de clivage. Chez S. cerevisiae, le complexe de polyadénylation est formé par 20 protéines, regroupées principalement en deux sous-complexes : CF IA et CPF. Nous nous intéressons plus spécifiquement à Pcf11, sous-unité du complexe CF IA. Pcf11 est formé de sept sous-domaines, mais la fonction d’une grande partie de la protéine n’est pour l’instant pas connue. Par exemple, aucune fonction n’est associée à la région située entre le domaine d’interaction avec le CTD de l’ARN polymérase II (CID) et une répétion de 20 résidus glutamines. Récemment, la structure de ce domaine, appelé 2nd NTD a été décrite. Pour essayer de comprendre la fonction du 2nd NTD et des motifs liant le zinc encadrant le domaine d’interaction avec Clp1, nous avons mis en place une stratégie systématique de mutagénèse, soit par délétions, soit par mutations ponctuelles. Le 2nd NTD est formé de trois hélices α et interagit avec l’ARN. La délétion de ce domaine conduit à un phénotype de croissance lente chez la levure et un défaut de terminaison de transcription des snoRNAs. Malgré une similarité de structure et de fonction, le 2nd NTD présenterait une fonction indépendante. La fonction des motifs liant le zinc n’est pour l’instant pas connue. Cependant, la mutation de l’un de ces deux motifs conduit à un défaut de clivage et de polyadénylation in vitro. La mutation des deux motifs est létale chez la levure. / In eukaryotes, poly (A) tails are added to nuclear pre-mRNA 3'-ends in the two steps of cleavage and polyadenylation. This co-transcriptional processing requires the activity of a large protein complex comprising at least 20 different polypeptides in yeast organized primarily into the two factors CF IA and CPF. We are interested in the functional characterization of Pcf11, a CF IA subunit. The Pcf11 protein is organized into seven different domains, but here is still a large portion of the polypeptide that has not yet been characterized. For example the region from the end of the CTD interaction domain (CID) to an uninterrupted stretch of 20 glutamine residues has no known function. Recently, the structure of this region, called the 2nd NTD have been characterized. To gain insight into the function of the 2nd NTD and the two zinc fingers motif surrounding the Clp1 interaction domain, we have employed a systematic strategy of mutagenesis, either by deletion or via point mutations. The 2nd NTD is a folded domain composed of three α-helices. The deletion of this domain induced a severe defect of growth in yeast and impaired transcription termination of snoRNAs. Despite its similarity in structure and function with the CID, the 2nd NTD seems to act like an independent RNA binding domain. We don’t know yet the real function of the two zinc fingers motif at the C-terminal region of Pcf11, but the mutation of Cystein residues into serine of one of the two motifs impaired cleavage and polyadenylation. The mutation of the first motif is less harmful than the mutation of the second motif. The simultaneous mutation is lethal in yeast.
|
27 |
La régulation de G3BP1 par TDP-43 dans le contexte de la sclérose latérale amyotrophique et la démence fronto-temporaleSidibé, Hadjara 12 1900 (has links)
La sclérose latérale amyotrophique (SLA) et la démence fronto-temporale (DFT) sont des maladies neurodégénératives fatales, actuellement sans traitement. Ces maladies entrainent la dégénérescence des neurones moteurs et corticaux, engendrant des troubles moteurs et cognitifs et ultimement menant à la mort des patients souvent par détresse respiratoire trois à cinq ans après l’apparition des premiers symptômes. À l’échelle d’une vie, le risque de développer ces pathologies est de 1 pour 300-400 pour la SLA et 1 pour 742 pour la DFT, faisant de ces pathologies un risque majeur. Avec le vieillissement de la population que nous connaissons actuellement, il est évident que l’incidence de ces maladies deviendra de plus en plus élevée. Ainsi il est essentiel de comprendre les mécanismes moléculaires sous-jacents à ces pathologies dans le but de développer des thérapies effectives et prévenir l’impact de ces pathologies dans notre société. À ce jour, l’étiologie de la SLA-DFT est encore débattue, cependant la communauté scientifique s’accorde sur le fait que l’interaction entre la génétique et l’environnement joue un rôle essentiel dans le développement de ces maladies. La caractéristique moléculaire principale de ces pathologies est la localisation cytoplasmique de la protéine, normalement, nucléaire TDP-43. TDP-43 est un régulateur clef de l’homéostasie des ARNs. Parmi ces nombreuses fonctions, TDP-43 régule la formation des granules de stress, en régulant leur protéine régulatrice G3BP1. Ces granules formés d’ARN et de protéines se forment pour protéger les cellules durant une période de stress. Récemment, ces granules ont fait l’objet de nombreuses études et leurs dysfonctions ont été associées à la SLA-DFT. Dans cette thèse, nous avons approfondi l’étude de la régulation de TDP-43 sur G3BP1. Nous avons défini que TDP-43 stabilise les transcrits de G3BP1 de par une liaison forte à une séquence conservée à travers l’évolution se situant dans le 3’UTR de G3BP1. La perte de localisation nucléaire, la présence de mutations ou de TDP-35, une isoforme pathologique de TDP-43, sont associées à une diminution des niveaux de G3BP1. Également, d’un point de vue histopathologique, dans le cortex orbitofrontal des patients atteints de SLA-DFT, les neurones présentant une localisation cytoplasmique de TDP-43 ont une perte des niveaux transcriptionnels de G3BP1, associant alors directement G3BP1 à la maladie. Par la suite, nous avons défini que la perte de fonction en tant que stabilisateur, permet la liaison de microARNs sur les transcrits de G3BP1, engendrant leur dégradation. Le blocage de la liaison de microARNs sur G3BP1 empêche la dégradation des transcrits et restaure les fonctions de la protéine. Ainsi, nous avons déterminé un moyen de contrer la perte de fonction de TDP-43 sur G3BP1. De façon intéressante, en plus de la formation des granules de stress, G3BP1 est essentielle pour l’homéostasie neuronale et la survie neuronale post-stress. Par conséquent, la restauration de la protéine est potentiellement une avenue thérapeutique multi-approche pour le traitement de ces maladies. / Amyotrophic lateral sclerosis (ALS) and frontotemporal dementia (FTD) are two fatal neurodegenerative diseases, currently without cure. These diseases lead to the degeneration of motor and cortical neurons, causing motor and cognitive disorders and ultimately leading to death, often from respiratory distress three to five years after the onset. Over a lifetime, the risk of
developing these conditions is 1 in 300-400 for ALS and 1 in 742 for FTD, making these conditions a major risk. With the current aging of the population, it is evident that the incidence of these diseases will become increasingly high. It is therefore essential to understand the molecular mechanisms underlying these pathologies in order to develop effective therapies. To this day, the etiology of ALS-FTD is still debated. However, the scientific community agrees that the interaction between genetics and the environment play an essential role in the development of these diseases. The main molecular characteristic of these pathologies is the cytoplasmic localization of the normally nuclear protein TDP-43. TDP-43 is a key regulator of RNA homoeostasis. Among these many functions, TDP-43 regulates the formation of stress granules,
by regulating their nucleator protein G3BP1. These granules of RNA and protein form to protect cells during times of stress. Recently these granules have been the subject of several studies and their dysfunction has been associated with ALS-FTD.
In this thesis, we have deepened the study of the regulation of TDP-43 on G3BP1. We have defined that TDP-43 stabilizes G3BP1 transcripts by strong binding to a sequence conserved through evolution located in the 3'UTR of G3BP1. Loss of nuclear localization, the presence of mutations or of TDP-35, a pathological isoform of TDP-43, are associated with decreased levels of G3BP1. Also, histopathologically, in the orbitofrontal cortex of patients with ALS-DFT, neurons with cytoplasmic localization of TDP-43 have a loss of transcriptional levels of G3BP1, directly associating G3BP1 with the disease. Subsequently, we defined that TDP-43 loss of function as a stabilizer allows the binding of two microRNAs on the G3BP1 transcripts, causing their degradation. Blocking the binding of these microRNAs to G3BP1 prevents the degradation
of the transcripts and restores the functions of the protein. Thus, we have determined a way to counter the loss of function of TDP-43 on G3BP1. Interestingly, in addition to the formation of stress granules, G3BP1 is essential for neuronal homoeostasis and post-stress neuronal survival. Therefore, the restoration of the protein is potentially a multi-approach therapeutic avenue for the treatment of these diseases.
|
28 |
Recherche des partenaires de l’ARN hélicase à boîte DEAD de levure Ded1 / Identifying and characterizing the protein partners of the yeast DEAD-box “helicase” Ded1Senissar, Meriem 30 September 2013 (has links)
L’ARN hélicase à boite DEAD de la levure S.cerevisiae Ded1 est une protéine essentielle dont la fonction a été conservée au cours de l’évolution. Ses homologues fonctionnels sont impliqués dans le développement et le cycle cellulaire. Ded1 a longtemps été associée à l’étape de scanning de la région 5’UTR des ARNm au niveau de l’initiation de la traduction. Nous avons utilisé différentes approches comme les co-immunoprécipitations, des analyses de spectrométrie de masse, des tests de complémentation génétique, de séparation des complexes sur gradients de saccharose, des expériences de localisation in situ et d’enzymologie pour montrer que Ded1 interagissait physiquement avec des complexes cytoplasmique et nucléaire de liaison à la coiffe des ARNm. Nous avons également montré que Ded1 peut passer du noyau vers le cytoplasme par différentes voies d’export nucléaire. De façon intéressante, ses partenaires protéines sont capables de stimuler son activité ATPase. De plus, nous avons montré qu’il existait un lien génétique entre Ded1 et ses partenaires. Nous avons également montré que Ded1 colocalise partiellement avec ses partenaires dans des gradients de saccharose, suggérant que Ded1 pourrait être associée à certains mRNPs. Nos résultats encore préliminaires indiquent que Ded1 pourrait s’associer à d’autre ARNs coiffés. Ainsi, Ded1 pourrait remodeler les complexes associés à différentes étapes de la vie des ARN coiffés. / The budding yeast DEAD-box RNA helicase Ded1 is an essential yeast protein that is closely related to a subfamily of DEAD-box proteins that are involved in developmental and cell-cycle regulation. Ded1 is generally considered to be a translation-initiation factor that helps the 40S ribosome scan the mRNA from the 5' 7-methylguanosine cap to the AUG start codon. We have used IgG pulldown experiments, mass spectroscopy analyses, genetic experiments, saccharose gradients, in situ localizations, and enzymatic assays to show that Ded1 is a cap-associated factor that actively shuttles between the cytoplasm and the nucleus. We show that Ded1 physically interacts with various cap-associated factors and that its enzymatic activity is stimulated by these factors. By using various mutated proteins, we show that Ded1 is genetically linked to these factors. Ded1 comigrates with these factors on saccharose gradients, but the peak of Ded1 sediments slightly heavier than for the other factors, which suggests that Ded1 is predominately associated with a subset of the mRNPs. Finally, purification of the protein complexes associated with Ded1 and subsequent analysis by nanoLC-MS/MS indicates that Ded1 is associated with both nuclear and cytoplasmic mRNPs. Preliminary experiements showed that Ded1 can associate with other capped RNA. We conclude that Ded1 may function as a remodeling factor that is needed to form the different complexes associated with the different processing steps of the capped RNA.
|
29 |
Clusters de gènes de résistance aux maladies chez le haricot commun : bases moléculaires, régulation et évolution / Disease resistance gene clusters in common bean : molecular basis, regulation and evolutionRichard, Manon 16 December 2014 (has links)
Le haricot commun est la légumineuse à graine la plus consommée au monde en alimentation humaine. Le génome du haricot possède plusieurs énormes clusters de gènes de résistance (R) qui ont la particularité de se cartographier en extrémité de groupes de liaison. Le génome du haricot commun (génotype Andin G19833) a été récemment séquencé et nous avons participé à ce projet en annotant la famille des NB-LRR (NL), classe prépondérante des gènes de résistance. Ces données génomiques nous ont permis de réaliser les 3 études suivantes. (i) L’identification des bases moléculaires de Co-x un gène R vis-à-vis d’une souche très virulente de C. lindemuthianum chez JaloEEP558 a été initiée. La cartographie fine de Co-x suivie du séquençage de la région cible chez JaloEEP558 (Co-x) a permis d’identifier un gène candidat codant une kinase atypique qui pourrait être la cible d’un effecteur fongique, gardée par un gène R. (ii) Des études récentes ont mis en évidence l’implication de petits ARNs (miRNAs induisant la production de phased siRNAs) dans la régulation de l’expression des NL. Le séquençage et l’analyse de banques de sRNAs de haricot nous ont permis d’identifier ce mécanisme et de mettre le doigt sur un nouveau mécanisme de régulation des NL impliquant des sRNAs de 24 nt. (iii) Des ADN satellites ont été étudiés à l’échelle du génome du haricot. L’étude des centromères de haricot a permis de mettre en évidence l’existence de 2 ADN satellites différents, Nazca et CentPv2. Nous avons également étudié un ADN satellite subtélomérique khipu précédemment identifié au niveau de 2 clusters de gènes R du haricot. L’étude de khipu à l’échelle du génome suggère l’existence d’échanges fréquents de séquences entre subtélomères de chromosomes non homologues. Ces résultats nous ont amenés à proposer que des éléments structuraux et une combinaison de mécanismes de régulation (TGS et PTGS) permettent la prolifération des NL sans effet néfaste pour la plante, conduisant à l’obtention de très gros clusters de NL dans le génome du haricot. / Common bean is the main source of protein for human consumption in many developing countries. Several huge disease resistance (R) gene clusters have been mapped at the end of common bean linkage groups. The common bean genome (Andean genotype G19833) has recently been sequenced. Access to the complete genome sequence of common bean allowed us to annotate the Nucleotide Binding-Leucine Rich Repeat (NL) encoding gene family, the prevalent class of disease R genes in plants, and to perform the 3 following studies: (i) We have investigated the molecular basis of Co-x, an anthracnose R gene to a highly virulent strain of C. lindemuthianum, previously identified in the Andean cultivar JaloEEP558. Fine mapping of Co-x and sequencing of the target region in JaloEEP558, allowed us to identify a candidate gene encoding an atypical kinase. We hypothesised that this atypical kinase is a fungal effector target. (ii) Several recent studies have highlighted the role of small RNA (miRNAs that triggered phased siRNAs production) in the regulating of NL gene expression. Analyses of small RNAs libraries of common bean led to the identification of this mechanism in common bean and also allowed us to propose a new NL regulation pathway involving 24 nt sRNAs. (iii) We have studied centromeric and subtelomeric satellite DNAs at common bean genome level. We have identified 2 different satellite DNAs in common bean centromeres, Nazca and CentPv2. We have also conducted the analyze of the subtelomeric satellite khipu, previously identified in common bean R clusters and confirmed that frequent sequence exchange occurs between non-homologous chromosome ends in common bean genome. Together, these results led us to propose that both structural elements and a combination of regulatory mechanisms (TGS, PTGS) allow the amplification of NL sequences without detrimental effect for the plant leading to the large NL clusters observed in common bean.
|
30 |
MiRNA and co : methodologically exploring the world of small RNAs / MiARN et compagnie : une exploration méthodologique du monde des petits ARNsHigashi, Susan 26 November 2014 (has links)
La principale contribution de cette thèse est le développement d'une méthode fiable, robuste, et rapide pour la prédiction des pré-miARNs. Deux objectifs avaient été assignés : efficacité et flexibilité. L'efficacité a été rendue possible au moyen d'un algorithme quadratique. La flexibilité repose sur deux aspects, la nature des données expérimentales et la position taxonomique de l'organisme (en particulier plantes ou animaux). Mirinho accepte en entrée des séquences de génomes complets mais aussi les très nombreuses séquences résultant d'un séquençage massif de type NGS de “RNAseq”. “L'universalité” taxonomique est obtenu par la possibilité de modifier les contraintes sur les tailles de la tige (double hélice) et de la boule terminale. Dans le cas de la prédiction des miARN de plantes la plus grande longueur de leur pré-miARN conduit à des méthodes d'extraction de la structure secondaire en tige-boule moins précises. Mirinho prend en compte ce problème lui permettant de fournir des structures secondaires de pré-miARN plus semblables à celles de miRBase que les autres méthodes disponibles. Mirinho a été utilisé dans le cadre de deux questions biologiques précises l'une concernant des RNAseq l'autre de l'ADN génomique. La première question a conduit au traitement et l'analyse des données RNAseq de Acyrthosiphon pisum, le puceron du pois. L'objectif était d'identifier les miARN qui sont différentiellement exprimés au cours des quatre stades de développement de cette espèce et sont donc des candidats à la régulation des gènes au cours du développement. Pour cette analyse, nous avons développé un pipeline, appelé MirinhoPipe. La deuxieme question a permis d'aborder les problèmes liés à la prévision et l'analyse des ARN non-codants (ARNnc) dans la bactérie Mycoplasma hyopneumoniae. Alvinho a été développé pour la prédiction de cibles des miRNA autour d'une segmentation d'une séquence numérique et de la détection de la conservation des séquences entre ncRNA utilisant un graphe k-partite. Nous avons finalement abordé un problème lié à la recherche de motifs conservés dans un ensemble de séquences et pouvant ainsi correspondre à des éléments fonctionnels / The main contribution of this thesis is the development of a reliable, robust, and much faster method for the prediction of pre-miRNAs. With this method, we aimed mainly at two goals: efficiency and flexibility. Efficiency was made possible by means of a quadratic algorithm. Flexibility relies on two aspects, the input type and the organism clade. Mirinho can receive as input both a genome sequence and small RNA sequencing (sRNA-seq) data of both animal and plant species. To change from one clade to another, it suffices to change the lengths of the stem-arms and of the terminal loop. Concerning the prediction of plant miRNAs, because their pre-miRNAs are longer, the methods for extracting the hairpin secondary structure are not as accurate as for shorter sequences. With Mirinho, we also addressed this problem, which enabled to provide pre-miRNA secondary structures more similar to the ones in miRBase than the other available methods. Mirinho served as the basis to two other issues we addressed. The first issue led to the treatment and analysis of sRNA-seq data of Acyrthosiphon pisum, the pea aphid. The goal was to identify the miRNAs that are expressed during the four developmental stages of this species, allowing further biological conclusions concerning the regulatory system of such an organism. For this analysis, we developed a whole pipeline, called MirinhoPipe, at the end of which Mirinho was aggregated. We then moved on to the second issue, that involved problems related to the prediction and analysis of non-coding RNAs (ncRNAs) in the bacterium Mycoplasma hyopneumoniae. A method, called Alvinho, was thus developed for the prediction of targets in this bacterium, together with a pipeline for the segmentation of a numerical sequence and detection of conservation among ncRNA sequences using a kpartite graph. We finally addressed a problem related to motifs, that is to patterns, that may be composed of one or more parts, that appear conserved in a set of sequences and may correspond to functional elements.
|
Page generated in 0.0585 seconds