281 |
Caractérisation systématique des motifs de régulation en cis à l’échelle transcriptomique et liens avec la localisation des ARNBenoit Bouvrette, Louis Philip 04 1900 (has links)
La localisation subcellulaire de l’ARN permet un déploiement prompt et spatialement restreint autant des activités protéiques que des ARN noncodant. Le trafic d’ARN est dirigé par des éléments de séquences (sous-séquences primaires, structures secondaires), aussi appelés motifs de régulation, présents en cis à même la molécule d’ARN. Ces motifs sont reconnus par des protéines de liaisons aux ARN qui médient l’acheminement des transcrits vers des sites précis dans la cellule. Des études récentes, chez l’embryon de Drosophile, indiquent que la majorité des ARN ont une localisation subcellulaire asymétrique, suggérant l’existence d’un « code de localisation » complexe. Cependant, ceci peut représenter un exemple exceptionnel et la question demeurait, jusqu’ici, si une prévalence comparable de localisation d’ARN est observable chez des cellules standards développées en culture. De plus, des informations facilement disponibles à propos des caractéristiques de distribution topologique d’instances de motifs à travers des transcriptomes complets étaient jusqu’à présent manquantes.
Afin d’avoir un aperçu de l’étendue et des propriétés impliquées dans la localisation des ARN, nous avons soumis des cellules de Drosophile (D17) et de l’humain (HepG2) à un fractionnement biochimique afin d’isoler les fractions nucléaire, cytosolique, membranaire et insoluble. Nous avons ensuite séquencé en profondeur l’ARN extrait et analysé par spectrométrie de masse les protéines extraites de ces fractions. Nous avons nommé cette méthode CeFra-Seq. Par des analyses bio-informatiques, j’ai ensuite cartographié l’enrichissement de divers biotypes d’ARN (p. ex. ARN messager, ARN long non codant, ARN circulaire) et protéines au sein des fractions subcellulaires. Ceci a révélé que la distribution d’un large éventail d’espèces d’ARN codants et non codants est asymétrique. Une analyse des gènes orthologues entre mouche et humain a aussi démontré de fortes similitudes, suggérant que le processus de localisation est évolutivement conservé. De plus, j’ai observé des attributs (p. ex. la taille des transcrits) distincts parmi les populations d’ARN messagers spécifiques à une fraction. Finalement, j’ai observé des corrélations et anti-corrélations spécifiques entre certains groupes d’ARN messagers et leurs protéines.
Pour permettre l’étude de la topologie de motifs et de leurs conservations, j’ai créé oRNAment, une base de données d’instances présumée de sites de liaison de protéines chez des ARN codants et non codants. À partir de données de motifs de liaison protéique par RNAcompete et par RNA Bind-n-Seq, j’ai développé un algorithme permettant l’identification rapide d’instances potentielles de ces motifs dans un transcriptome complet. J’ai pu ainsi cataloguer les instances de 453 motifs provenant de 223 protéines liant l’ARN pour 525 718 transcrits chez cinq espèces. Les résultats obtenus ont été validés en les comparant à des données publiques de eCLIP.
J’ai, par la suite, utilisé oRNAment pour analyser en détail les aspects topologiques des instances présumées de ces motifs et leurs conservations évolutives relatives. Ceci a permis de démontrer que la plupart des motifs sont distribués de façon similaire entre espèces. De plus, j’ai discerné des points communs entre les sous-groupes de protéines liant des biotypes distincts ou des régions d’ARN spécifiques. La présence de tels patrons, similaires ou non, entre espèces est susceptible de refléter l’importance de leurs fonctions. D’ailleurs, l’analyse plus détaillée du positionnement d’un motif entre régions transcriptomiques comparables chez les vertébrés suggère une conservation synténique de ceux-ci, à divers degrés, pour tous les biotypes d’ARN. La topologie régionale de certaines instances de motifs répétées apparaît aussi comme évolutivement conservée et peut être importante afin de permettre une liaison adéquate de la protéine. Finalement, les résultats compilés avec oRNAment ont permis de postuler sur un nouveau rôle potentiel pour l’ARN long non codant HELLPAR comme éponge de protéines liant l’ARN.
La caractérisation systématique d’ARN localisés et de motifs de régulation en cis présentée dans cette thèse démontre comment l’intégration d’information à l’échelle transcriptomique permet d’évaluer la prévalence de l’asymétrie, les caractéristiques distinctes et la conservation évolutive de collections d’ARN. / The subcellular localization of RNA allows a rapid and spatially restricted deployment of protein and noncoding RNA activities. The trafficking of RNA is directed by sequence elements (primary subsequences, secondary structures), also called regulatory motifs, present in cis within the RNA molecule. These motifs are recognized by RNA-binding proteins that mediate the transport of transcripts to specific sites in the cell. Recent studies in the Drosophila embryo indicate that the majority of RNAs display an asymmetric subcellular localization, suggesting the existence of a complex "localization code". However, this may represent an exceptional example and the question remained, until now, whether a comparable prevalence of RNA localization is observable in standard cells grown in culture. In addition, readily available information about the topological distribution of pattern instances across full transcriptomes has been hitherto lacking.
In order to have a broad overview of the extent and properties involved in RNA localization, we subjected Drosophila (D17) and human (HepG2) cells to biochemical fractionation to isolate the nuclear, cytosolic, membrane and insoluble fractions. We then performed deep sequencing on the extracted RNA and analyzed through mass spectrometry the proteins extracted from these fractions. We named this method CeFra-Seq. Through bioinformatics analyses, I then profiled the enrichment of various RNA biotypes (e.g. messenger RNA, long noncoding RNA, circular RNA) and proteins within the subcellular fractions. This revealed the high prevalence of asymmetric distribution of both coding and noncoding RNA species. An analysis of orthologous genes between fly and human has also shown strong similarities, suggesting that the localization process is evolutionarily conserved. In addition, I have observed distinct attributes (e.g. transcript size) among fraction-specific messenger RNA populations. Finally, I observed specific correlations and anti-correlations between defined groups of messenger RNAs and the proteins they encode. To study motifs topology and their conservation, I created oRNAment, a database of putative RNA-binding protein binding sites instances in coding and noncoding RNAs. Using data from protein binding motifs assessed by RNAcompete and by RNA Bind-n-Seq experiments, I have developed an algorithm allowing their rapid identification in a complete transcriptome. I was able to catalog the instances of 453 motifs from 223 RNA-binding proteins for 525,718 transcripts in five species. The results obtained were validated by comparing them with public data from eCLIP.
I then used oRNAment to further analyze the topological aspects of these motifs’ instances and their relative evolutionary conservation. This showed that most motifs are distributed in a similar fashion between species. In addition, I have detected commonalities between the subgroups of proteins linking preferentially distinct biotypes or specific RNA regions. The presence or absence of such pattern between species is likely a reflection of the importance of their functions. Moreover, a more precise analysis of the position of a motif among comparable transcriptomic regions in vertebrates suggests a syntenic conservation, to varying degrees, in all RNA biotypes. The regional topology of certain motifs as repeated instances also appears to be evolutionarily conserved and may be important in order to allow adequate binding of the protein. Finally, the results compiled with oRNAment allowed to postulate on a potential new role for the long noncoding RNA HELLPAR as an RNA-binding protein sponge.
The systematic characterization of RNA localization and cis regulatory motifs presented in this thesis demonstrates how the integration of information at a transcriptomic scale enables the assessment of the prevalence of asymmetry, the distinct characteristics and the evolutionary conservation of RNA clusters.
|
282 |
Modélisation des réseaux de régulation de l’expression des gènes par les microARNPoirier-Morency, Guillaume 12 1900 (has links)
Les microARN sont de petits ARN non codants d'environ 22 nucléotides impliqués dans la régulation de l'expression des gènes. Ils ciblent les régions complémentaires des molécules d'ARN messagers que ces gènes codent et ajustent leurs niveaux de traduction en protéines en fonction des besoins de la cellule. En s'attachant à leurs cibles par complémentarité partielle de leurs séquences, ces deux groupes de molécules d'ARN compétitionnent activement pour former des interactions régulatrices. Par conséquent, prédire quantitativement les concentrations d'équilibres des duplexes formés est une tâche qui doit prendre un compte plusieurs facteurs dont l'affinité pour l'hybridation, la capacité à catalyser la cible, la coopérativité et l'accessibilité de l'ARN cible. Dans le modèle que nous proposons, miRBooking 2.0, chaque interaction possible entre un microARN et un site sur un ARN cible pour former un duplexe est caractérisée par une réaction enzymatique. Une réaction de ce type opère en deux phases : une formation réversible d'un complexe enzyme-substrat, le duplexe microARN-ARN, suivie d'une conversion irréversible du substrat en produit, un ARN cible dégradé, et de la restitution l'enzyme qui pourra participer à une nouvelle réaction. Nous montrons que l'état stationnaire de ce système, qui peut comporter jusqu'à 10 millions d'équations en pratique, est unique et son jacobien possède un très petit nombre de valeurs non-nulles, permettant sa résolution efficace à l'aide d'un solveur linéaire épars. Cette solution nous permet de caractériser précisément ce mécanisme de régulation et d'étudier le rôle des microARN dans un contexte cellulaire donné. Les prédictions obtenues sur un modèle de cellule HeLa corrèlent significativement avec un ensemble de données obtenu expérimentalement et permettent d'expliquer remarquablement les effets de seuil d'expression des gènes. En utilisant ces prédictions comme condition initiale et une méthode d'intégration numérique, nous simulons en temps réel la réponse du système aux changements de conditions expérimentales. Nous appliquons ce modèle pour cibler des éléments impliqués dans la transition épithélio-mésenchymateuse (EMT), un mécanisme biologique permettant aux cellules d'acquérir une mobilité essentielle pour proliférer. En identifiant des éléments transcrits différentiellement entre les conditions épithéliale et mésenchymateuse, nous concevons des microARN synthétiques spécifiques pour interférer avec cette transition. Pour ce faire, nous proposons une méthode basée sur une recherche gloutonne parallèle pour rechercher efficacement l'espace de la séquence du microARN et présentons des résultats préliminaires sur des marqueurs connus de l'EMT. / MicroRNAs are small non-coding RNAs of approximately 22 nucleotide long
involved in the regulation of gene expression. They target complementary
regions to the RNA transcripts molecules that these genes encode and adjust the concentration according to the needs of the cell.
As microRNAs and their RNA targets binds each other with imperfect complementarity, these two groups actively compete to form regulatory interactions. Consequently, attempting to quantitatively predict their equilibrium concentrations is a task that must take several factors into account, including the affinity for hybridization, the ability to catalyze the target, cooperation, and RNA accessibility.
In the model we propose, miRBooking 2.0, each possible interaction between
a microRNA and a binding site on a target RNA is characterized by an enzymatic
reaction. A reaction of this type operates in two phases: a reversible formation
of an enzyme-substrate complex, the microRNA-RNA duplex, and an irreversible
conversion of the substrate in an RNA degradation product that restores the
enzyme which can subsequently participate to other reactions.
We show that the stationary state of this system, which can include up to 10 million equations in practice, has a very shallow Jacobian, allowing its efficient resolution using a sparse linear solver. This solution allows us to
characterize precisely the mechanism of regulation and to study the role of
microRNAs in a given cellular context. Predictions obtained on a HeLa S3 cell
model correlate significantly with a set of experimental data obtained
experimentally and can remarkably explain the expression threshold effects of
genes. Using this solution as an initial condition and an explicit method of
numerical integration, we simulate in real time the response of the system to
changes of experimental conditions.
We apply this model to target elements involved in the Epithelio-Mesenchymal Transition (EMT), an important mechanism of tumours proliferation. By
identifying differentially expressed elements between the two conditions, we
design synthetic microRNAs to interfere with the transition. To do so, we
propose a method based on a parallel greedy best-first search to efficiently
crawl the sequence space of the microRNA and present preliminary results on
known EMT markers.
|
283 |
Tirer profit de l’espace de séquence : une approche multidisciplinaire pour élucider l’évolution d’une famille d’enzymes primitivesLemay-St-Denis, Claudèle 01 1900 (has links)
L’habileté des enzymes à évoluer joue un rôle fondamental dans l'adaptation des organismes à leur environnement, leur permettant de s'adapter aux changements de température, aux nutriments disponibles ou encore à l'introduction de composés cytotoxiques. Au cours des dernières décennies, cette capacité a conduit à l'émergence rapide de mécanismes de résistance aux antibiotiques chez des bactéries pathogènes pour l’humain, notamment dans le cas de l'antibiotique synthétique triméthoprime. Dix ans après l'introduction de cet antibiotique, l'enzyme dihydrofolate réductase de type B (DfrB) a été identifiée comme conférant une résistance aux bactéries l'exprimant en catalysant par voie d’enzyme alternative la réaction inhibée par l’antibiotique.
Des études structurales, cinétiques et mécanistiques de la DfrB en ont révélé la nature atypique, et suggèrent que cette enzyme est un modèle d’enzyme primitive. En particulier, son site actif unique est formé via l’interface de quatre protomères identiques. Puisque les DfrB ne sont pas apparentées sur le plan évolutif à des protéines connues et caractérisées, on ne connait pas comment elles ont évolué pour ultimement contribuer à la résistance au triméthoprime, et en particulier comment leur capacité catalytique a émergé au sein du petit domaine codé par leurs gènes. Ainsi, cette thèse vise à approfondir notre compréhension de l’évolution des enzymes en examinant spécifiquement l’évolution des DfrB et les propriétés qui ont guidé ce processus.
Puisque les gènes des DfrB ont rarement été rapportés, je présente d’abord nos efforts déployés pour identifier et caractériser de manière génomique les DfrB dans les bases de données publiques. Ces efforts ont conduit à la découverte, pour la première fois, de DfrB en dehors du contexte clinique. Nous avons ensuite caractérisé, sur le plan biophysique et enzymatique, des homologues protéiques aux DfrB que nous avons identifiés dans des bases de données de protéines putatives. Nous avons démontré la capacité d’homologues identifiés dans des contextes environnementaux, non associés aux activités humaines, à catalyser la réduction du dihydrofolate de la même façon que les DfrB. Enfin, une large exploration d’homologues de séquence, suivie d'une caractérisation expérimentale et computationnelle, nous a permis d'identifier des homologues distants des DfrB, certains capables de procurer une résistance au triméthoprime, et d'autres dépourvus de cette capacité. Ces résultats nous ont permis de proposer un modèle expliquant l’émergence de l'activité catalytique au sein du domaine protéique des DfrB.
En résumé, cette thèse présente une approche multidisciplinaire pour l’exploration et la caractérisation de l’espace de séquence d’une famille de protéines. Cette approche, qui comprend des analyses génomiques, enzymologiques, biophysiques et bio-informatiques, nous a permis d’identifier les caractéristiques structurales et de séquences nécessaires à la formation d’une enzyme DfrB fonctionnelle. Nous avons également proposé un modèle pour expliquer l’évolution de cette enzyme primitive. Dans l’ensemble, nos résultats suggèrent que la capacité catalytique des DfrB a évolué indépendamment de l’introduction de l’antibiotique triméthoprime, et donc que ce mécanisme de résistance existait dans l’environnement préalablement à son recrutement génomique dans un contexte clinique.
Ces travaux contribuent à notre compréhension fondamentale des mécanismes sous-jacents à l’émergence de l’activité catalytique au sein d’un domaine protéique non catalytique, et informent les études des mécanismes développés par les bactéries pour proliférer en présence d’antibiotiques. / The ability of enzymes to evolve plays a fundamental role in the adaptation of organisms to their environment, allowing them to adjust to changes in temperature, available nutrients, or the introduction of cytotoxic compounds. In recent decades, this ability has led to the rapid emergence of antibiotic resistance mechanisms in human pathogenic bacteria, particularly in the case of the synthetic antibiotic trimethoprim. Ten years after the introduction of this antibiotic, the type B dihydrofolate reductase (DfrB) was identified as conferring resistance to bacteria expressing it by providing an alternative enzyme to catalyze the reaction inhibited by the antibiotic.
Structural, kinetic, and mechanistic studies of DfrB have revealed its atypical nature and suggest that this enzyme is a model of a primitive enzyme. In particular, its unique active site is formed by the interface of four identical protomers. Since DfrB enzymes are not evolutionarily related to any known and characterized proteins, it is not known how they evolved to ultimately contribute to trimethoprim resistance, and in particular how their catalytic ability arose within the small domain encoded by their genes. Thus, this thesis aims to deepen our understanding of enzyme evolution by specifically examining the evolution of DfrB and the properties that guided this process.
Since DfrB genes have rarely been reported, I first present our efforts to genomically identify and characterize DfrB in public databases. These efforts led to the first discovery of DfrB genes outside the clinical context. We then biophysically and enzymatically characterized protein homologues of the DfrB we identified in putative protein databases. We demonstrated the ability of homologues identified in environmental contexts unrelated to human activities to catalyze dihydrofolate reduction in the same manner as DfrB. Finally, a broad search for sequence homologues, followed by experimental and computational characterization, allowed us to identify distant DfrB homologues, some capable of conferring resistance to trimethoprim and others lacking this ability. These results have allowed us to propose a model that explains the emergence of catalytic activity within the DfrB domain.
In summary, this thesis presents a multidisciplinary approach to explore and characterize the sequence space of a protein family. This approach, which includes genomic, enzymatic, biophysical and bioinformatic analyses, has enabled us to identify the structural and sequence features necessary for the formation of a functional DfrB enzyme. We have also proposed a model to explain the evolution of this primitive enzyme. Overall, our results suggest that the catalytic capacity of DfrB evolved independently of the introduction of the antibiotic trimethoprim, and thus that this resistance mechanism existed in the environment prior to its genomic recruitment in a clinical context.
This work contributes to our fundamental understanding of the mechanisms underlying the emergence of catalytic activity within a non-catalytic protein domain, and informs studies of the mechanisms developed by bacteria to proliferate in the presence of antibiotics.
|
284 |
Novel bioinformatics programs for taxonomical classification and functional analysis of the whole genome sequencing data of arbuscular mycorrhizal fungiKang, Jee Eun 10 1900 (has links)
No description available.
|
285 |
Beyond hairballs: depicting complexity of a kinase-phosphatase network in the budding yeastAbd-Rabbo, Diala 01 1900 (has links)
No description available.
|
Page generated in 0.0777 seconds