Spelling suggestions: "subject:"génomique"" "subject:"phénomique""
61 |
Implication de la région C-terminale du variant d'histone H2A.Z dans sa localisation génomique et dans le contrôle de la transcription géniqueNeumann, Hannah January 2017 (has links)
H2A.Z, un variant de l'histone canonique H2A, est conservé chez divers organismes eucaryotes, de la levure aux mammifères, et son incorporation dans la chromatine permet de créer des domaines de chromatine spécialisés. Des analyses de la localisation de H2A.Z à l'échelle du génome ont démontré que H2A.Z se trouve préférentiellement dans les régions promotrices et régulatrices des gènes. De plus, il a été démontré que H2A.Z a une importance dans la régulation positive et négative de la transcription des gènes. H2A.Z est trouvé dans les promoteurs de gènes inactifs ou très peu transcrits et on pense que les nucléosomes contenant H2A.Z forment une structure de la chromatine spéciale qui prépare les nucléosomes à être désassemblés suite à l'activation de la transcription de ces gènes. La divergence principale entre les protéines de H2A.Z et H2A réside dans leurs régions C-terminales contenant le domaine d'amarrage, qui contacte le tétramère H3-H4 et possède une extension de résidus acidiques de l'hélice αC continuant sur l'histone H2B et qui forment une surface d'interaction. On pense que le domaine d'amarrage de H2A.Z pourrait représenter une plateforme de liaison à des partenaires d'interaction afin de moduler les activités de remodelage de la chromatine. Dans le but d'étudier le rôle fonctionnel de la région C-terminale du variant d'histone H2A.Z dans sa localisation génomique et dans le contrôle de la transcription génique, nous avons utilisé des protéines de fusion dérivées de H2A.Z exprimées dans l'organisme modèle Saccharomyces cerevisiae. En comparant les distributions de H2A.Z et des protéines de fusion à l'échelle du génome, nous démontrons que la localisation de H2A.Z au niveau des promoteurs, ainsi qu'à d'autres régions précises des chromosomes et d'autres éléments transcrits, est dépendante de sa région C-terminale. Nous avons observé que les gènes associés à H2A.Z sont impliqués dans plusieurs processus biologiques tels l'organisation du cytosquelette, la transcription des promoteurs reconnus par l'ARN polymérase II, le cycle cellulaire, la réparation de l'ADN, la ségrégation des chromosomes et l'épissage de l'ARN. De manière intéressante, nous démontrons que l'expression des gènes impliqués dans les processus enrichis pour les gènes associés à H2A.Z est dérégulée lorsque la région C-terminale de H2A.Z est modifiée. De plus, nous observons qu'environ le quart des gènes essentiels chez la levure sont des gènes associés à H2A.Z et que la modification de la région C-terminale de H2A.Z affecte également leur expression. Bien que le mécanisme d'action de H2A.Z dans le contrôle de la transcription ne soit pas tout à fait établi, cette étude permet de faire un rapprochement entre la localisation spécifique de H2A.Z aux promoteurs et son implication dans la régulation de la transcription. Dans cette étude, nous démontrons que la modification de la région C-terminale de H2A.Z entraîne des changements d'expression génique pouvant affecter plusieurs processus biologiques, tels que la réparation de l'ADN, la progression et régulation du cycle cellulaire et la mitose, souvent débalancés dans la carcinogenèse. Pour la première fois, nos résultats mettent en évidence un potentiel rôle transcriptionnel global pour la région C-terminale de H2A.Z chez Saccharomyces cerevisiae.
|
62 |
Métagénomique comparative de novo à grande échelle / Large scale de novo comparative metagenomicsBenoit, Gaëtan 29 November 2017 (has links)
La métagénomique comparative est dite de novo lorsque les échantillons sont comparés sans connaissances a priori. La similarité est alors estimée en comptant le nombre de séquences d’ADN similaires entre les jeux de données. Un projet métagénomique génère typiquement des centaines de jeux de données. Chaque jeu contient des dizaines de millions de courtes séquences d’ADN de 100 à 200 nucléotides (appelées lectures). Dans le contexte du début de cette thèse, il aurait fallu des années pour comparer une telle masse de données avec les méthodes usuelles. Cette thèse présente des approches de novo pour calculer très rapidement la similarité entre de nombreux jeux de données. Les travaux que nous proposons se basent sur le k-mer (mot de taille k) comme unité de comparaison des métagénomes. La méthode principale développée pendant cette thèse, nommée Simka, calcule de nombreuses mesures de similarité en remplacement les comptages d’espèces classiquement utilisés par des comptages de grands k-mers (k > 21). Simka passe à l’échelle sur les projets métagénomiques actuels grâce à un nouvelle stratégie pour compter les k-mers de nombreux jeux de données en parallèle. Les expériences sur les données du projet Human Microbiome Projet et Tara Oceans montrent que les similarités calculées par Simka sont bien corrélées avec les similarités basées sur des comptages d’espèces ou d’OTUs. Simka a traité ces projets (plus de 30 milliards de lectures réparties dans des centaines de jeux) en quelques heures. C’est actuellement le seul outil à passer à l’échelle sur une telle quantité de données, tout en étant complet du point de vue des résultats de comparaisons. / Metagenomics studies the genomic content of a sample extracted from a natural environment. Among available analyses, comparative metagenomics aims at estimating the similarity between two or more environmental samples at the genomic level. The traditional approach compares the samples based on their content in known identified species. However, this method is biased by the incompleteness of reference databases. By contrast, de novo comparative metagenomics does not rely on a priori knowledge. Sample similarity is estimated by counting the number of similar DNA sequences between datasets. A metagenomic project typically generates hundreds of datasets. Each dataset contains tens of millions of short DNA sequences ranging from 100 to 150 base pairs (called reads). In the context of this thesis, it would require years to compare such an amount of data with usual methods. This thesis presents novel de novo approaches to quickly compute the similarity between numerous datasets. The main idea underlying our work is to use the k-mer (word of size k) as a comparison unit of the metagenomes. The main method developed during this thesis, called Simka, computes several similarity measures by replacing species counts by k-mer counts (k > 21). Simka scales-up today’s metagenomic projects thanks to a new parallel k-mer counting strategy on multiple datasets. Experiments on data from the Human Microbiome Project and Tara Oceans show that the similarities computed by Simka are well correlated with reference-based and OTU-based similarities. Simka processed these projects (more than 30 billions of reads distributed in hundreds of datasets) in few hours. It is currently the only tool able to scale-up such projects, while providing precise and extensive comparison results.
|
63 |
Integrative analyses of genome-wide transcriptomic and genomic thyroid cancer profilesTarabichi, Maxime 25 January 2016 (has links)
Cette thèse en bioinformatique a été réalisée entre 2010 et 2015 dans le groupe du Pr. Vincent Detours à l’Institut de Recherche Interdisciplinaire en Biologie Humaine et Moléculaire. Nous avons analysé des données génomiques et transcriptomiques provenant de carcinomes papillaires de la thyroïde (CPTs) et leurs tissus non-cancéreux adjacents. La première partie étudiait les différences transcriptomiques entre CPTs post-Tchernobyl et CPTs sporadiques, et leur tissus non-cancéreux adjacents. Dans notre cohorte, les cas sporadiques étaient en moyenne et significativement un an plus jeunes. Après un ajustement des données transcriptionnelles pour l'âge, près de 400 gènes étaient plus exprimés dans les tissus adjacents des patients exposés aux radiations. Cependant, nous n’avons pu détecter aucune surreprésentation de groupe de gènes participant à des fonctions biologiques connues. Il était possible de distinguer les cas sporadiques des cas post-Tchernobyl sur base des transcriptomes de leurs tissus adjacents, avec une précision de ~70%. Cette surexpression de gènes dans les tissus non-cancéreux adjacents pourrait être liée à une radiosensibilité accrue dans le groupe des patients exposés aux radiations de Tchernobyl. Dans la deuxième étude, nous avons intégré des données provenant des patients de la première partie, incluant les nombres de copies d'ADN des CPTs, le génotype de plus de 400.000 SNPs dans le sang et les données transcriptionnelles des CPTs et leurs tissus non-cancéreux adjacents. En reproduisant les résultats d'une étude précédente, nous avons retrouvé la région 7q11.23 dupliquée exclusivement dans un tiers des patients exposés aux radiations. Dans une étude indépendante, un autre groupe a montré que la duplication de cette région était plus fréquente dans une population de lignées cellulaires radiosensibles que dans la population humaine normale. Cependant, en analysant les transcriptomes des patients présentant cette duplication, nous n'avons pas détecté de différence d’expression des gènes codés dans cette région génomique. En outre, aucun génotype de SNP n'était significativement lié à l'exposition aux radiations. En conclusion, les résultats confirment qu'un tiers des CPTs post-Tchernobyl ont des traces d'un dégât radio-sensibilsant dans leur ADN. Dans une troisième étude, nous avons étudié les différences transcriptionnelles entre CPTs et leurs métastases ganglionnaires (MGs) associées, ainsi qu'entre des CPTs développant des MGs (N+) et des CPTs ne développant pas de MGs (N0). Des études précédentes comparant les MGs et leurs tumeurs associées impliquant d’autres organes ont montré une surexpression de gènes dans les MGs, liés aux cellules immunitaires. Ce signal provient du tissu contaminant environnant les MGs. Pour se défaire de ce signal contaminant, d’autres études ont microdisséqué au laser les parties tumorales des MGs. Cependant, la microdissection retire aussi le stroma associé à la tumeur, alors que celui-ci est justement impliqué dans la progression tumorale. Grâce à une méthode originale, nous avons corrigé nos données d’expression des MGs pour leur contenu en contaminant ganglionnaire non-cancéreux. Après cette correction, l’expression de gènes liés au stroma était plus élevée dans les MGs que dans leurs CPTs. Les différences d’expression entre N0 et N+ n’étaient pas reproductibles entre 4 jeux de données indépendants de CPTs. Ceci démontre l’absence d’un signal transcriptionnelle lié au statut nodal dans ces données. Cependant, en utilisant des données publiques comprenant des centaines de tumeurs, il est possible de prédire le statut nodal (N0 ou N+) des CPTs ainsi que des cancers du sein et du colon à partir de leurs transcriptomes. Des études précédentes montraient des taux de prédiction presque parfaits (>90%) du statut nodal à partir des données transcriptomiques. Nous avons décelés dans ces études le même biais technique de sélection des gènes, qui peut expliquer ces taux artificiellement élevés. Dans notre étude, ce biais n’était pas présent et la précision de nos prédictions était limitée (<70%), questionnant l’intérêt clinique de telles prédictions. La présence d’un signal permettant de prédire le statut nodal et l’irreproductibilité de ce signal dans des jeux de données indépendants peuvent s'expliquer par l’association entre le statut nodal et des caractéristiques d'agressivité des tumeurs, qui pourraient, elles, avoir une influence reproductible sur les transcriptomes. Dans notre dernière étude, nous avons analysé les différences entre CPTs, liées à la présence de BRAFV600E, une mutation commune à 60% des CPTs. En utilisant un jeu de données public, nous avons montré que les CPTs présentant la mutation étaient plus dédifférenciés, et plus infiltrés en stroma, probablement en lymphocytes et fibroblastes; et que ces CPTs présentaient plus de fibrose et proliféraient sans doute plus. Tout ceci suggère que les CPTs mutés pour BRAF constituent un groupe de CPTs plus agressif. Des caractéristiques d’agressivité pourraient être détectées au front invasif, c’est-à-dire la périphérie de la tumeur définissant son contact avec le stroma, notamment la présence de regroupement de cellules isolées du reste de la tumeur. Dans les CPTs, ces îlots cellulaires isolés sont observés sur des lames histologiques 2D et pourraient être expliqués soit par un détachement cellulaire, signe d’agressivité lié au processus métastatique, soit une conformation complexe compatible avec une tumeur connexe en 3D. Dans un CPT, nous avons analysé la conformation 3D du front invasif d'un CPT muté. Nous avons reconstruit son volume 3D grâce à une méthode originale. Les groupes de cellules cancéreuses qui semblaient isolées sur les images 2D d’histopathologie, étaient en fait connectés en 3D. L’hypothèse de la présence de détachement cellulaire suite à la transition épithélio-mésenchymateuse n’est donc pas requise pour expliquer la présence de ces îlots cellulaires en 2D. La forme 3D du front invasif impliquait une surface de contact entre tumeur et stroma bien plus importante qu'impliquée par la forme ellipsoïde habituellement décrite. Les fibroblastes participaient autant à la création de la masse tumorale que les cellules cancéreuses, puisque ces deux groupes de cellules proliféraient à la même vitesse. A l'avenir, le séquençage du matériel génétique de cellules individuelles facilitera notre interprétation des signaux génomiques et transcriptomiques, qui jusqu’alors provenaient de tissu complet, i.e. un mélange de populations de cellules tumorales, stromales et de contaminant. Une signature de radiation pourrait être extraite des profils mutationnels de cellules individuelles exposées aux radiations et à l’H2O2 in vitro et comparée à la signature des CTPs post-Tchernobyl. Les cellules tumorales et stromales individuelles des MGs pourraient être comparées aux cellules tumorales et stromales invividuelles des CPTs. De même les cellules individuelles mutées pour BRAFV600E pourraient être comparées aux cellules non mutées. / Doctorat en Sciences biomédicales et pharmaceutiques (Médecine) / info:eu-repo/semantics/nonPublished
|
64 |
Étude de l'évolution combinatoire des gènes par l'analyse de réseaux de similarité de séquence / Using sequence similarity networks to study combinatorial evolution of genesJachiet, Pierre-Alain 02 July 2014 (has links)
L’accumulation récente de données de séquences génomiques a montré que l’évolution des gènes n’est pas strictement arborescente. De nombreux processus évolutifs, comme l’exon shuffling, la fusion de gènes ou la recombinaison illégitime remodèlent les gènes, créant des structures composites, formées de parties dont les histoires évolutives sont différentes. Le développement de réseaux de similarité de séquences fournit un cadre analytique permettant d’étudier l’impact de ces processus sur l’évolution moléculaire, en structurant les relations de ressemblance entre séquences et en formalisant en termes de graphes la détection de gènes (triplets intransitifs) et de familles de gènes (cliques minimales séparatrices) composites. La taille des jeux de données actuels, de l’ordre de plusieurs millions de séquences, a également requis le développement de nouveaux outils et méthodes : parallélisation des comparaisons de séquences, visualisation de très grands réseaux par simplification en communautés de Louvain et identification de grands cycles. Appliquées à des jeux de données de génomes eucaryotes et viraux, ces méthodes ont démontré la présence de gènes composites dans tout le vivant et les éléments génétiques mobiles. En proportion, les gènes composites sont plus nombreux dans les génomes eucaryotes ; en nombre absolu, ils sont plus nombreux à être portés par des virus. Chez ces derniers, la distribution fonctionnelle des gènes composites est biaisée (enrichissement dans les familles essentielles pour la perpétuation du cycle viral), et les éléments des gènes composites trouvent même parfois leurs origines dans le matériel génétique de classes virales différentes. Plus généralement, l’étendue des processus combinatoires, en révélant des liens évolutionnaires autres que les liens d’homologie au sens fort, justifie une étude pluraliste des relations de similarité entre séquences. / The recent accumulation of genomic sequence data has shown that gene evolution is not strictly tree-Like. Many evolutionary processes, like exon shuffling, gene fusion or nonhomologous recombination remodel genes by creating composite structures that are made from parts with different evolutionary histories. The development of sequence similarity networks provides an analytical framework to study the impact of these processes on molecular evolution, by structuring the resemblance relationships between sequences and by formalizing, in terms of graph theory, the detection of composite genes (intransitive triplets) and gene families (clique minimal separators). The size of current data sets, typically several million sequences, has also required the development of new tools and methods: sequence comparison parallelization, large networks visualization with Louvain communities and large cycles identification. When applied to eukaryotic and viral genome data sets, these methods have shown that composite genes are found throughout cellular organisms and mobile genetic elements. Proportionally, composite genes are more numerous in eukaryotic genomes; in absolute number, they are more numerous in viruses. In the latter, composite genes functional distribution is biased (enrichment of genes families that are essential for the perpetuation of the viral cycle), and the various parts of composite genes sometimes even originate from the genetic material of different viral classes. More generally, the extent of combinatorial processes, by unravelling other evolutionary bonds than homology bonds in the strictest sense, legitimates a pluralistic study of similarity relationships between sequences.
|
65 |
Contribution à l’étude de l’évolution des génomes de champignons ectomycorhiziens du genre Tuber (Pézizomycètes) par génomique comparative / Study of ectomycorrhizal fungi genomes evolution in the genus Tuber (Pezizomycetes) using comparative genomicsPayen, Thibaut 04 May 2015 (has links)
Les truffes sont des champignons ectomycorhiziens du genre Tuber, au sein des Pézizomycètes, vivant en symbiose avec de nombreux arbres et arbustes. Parmi les Pézizomycètes se retrouvent des espèces saprotrophes, pathogènes et symbiotiques ainsi que des champignons très connus comme les truffes et les morilles. Malgré leur intérêt, la structure et l'évolution des génomes des champignons de la classe des Pézizomycètes est encore mal connue. Les objectifs de ma thèse étaient de caractériser la structure et l'évolution des génomes de Truffes et d'autres Pézizomycètes. Une analyse de génomique comparative entre huit génomes de Pézizomycètes, dont trois de truffes, a montré que l'expansion de la taille des génomes des truffes, due principalement aux rétrotransposons gypsy, a probablement eu lieu chez l'ancêtre commun des Tuberaceae il y a environ 150 millions d'années. Ensuite, une réduction de leur contenu en gènes, et principalement en enzymes dégradant la paroi végétale, a eu lieu chez l'ancêtre des Tuber il y a environ 100 millions d'années. Des convergences et des divergences évolutives ont été mise en évidence entre les champignons ectomycorhiziens basidiomycètes et les truffes. Une analyse de génomique comparative au sein de l'espèce T. melanosporum a quant à elle permis de caractériser une ressource de plus de 400000 polymorphismes et de mettre en évidence des traces de sélection. Enfin une analyse plus détaillée des rétrotransposons gypsy présents dans le génome de T. melanosporum a montré que leur colonisation du génome est ancienne. Certains éléments semblent toutefois avoir transposé récemment suggérant que les rétrotransposons gypsy peuvent continuer de jouer un rôle dans l'évolution du génome de T. melanosporum / Truffles are ectomycorrhizal (ECM) fungi, belonging to Tuber genus in the Pezizomycete Class, that form symbiotic associations with numerous trees and shrubs. The Pezizomycetes constitute an early diverging lineage of Ascomycota composed of saprophytic, mycorrhizal and pathogenic species. Some Pezizomycetes, such as truffles and morels, are widely recognized by scientist and lay-person alike. Despite their importance, the genomic structure and evolution within the Pezizomycetes is largely unknown. The aims of my thesis were to characterize the structure and the evolution of the truffle and other Pezizomycete genomes. A comparative analysis performed using eight Pezizomycete fungi, among them three truffles, showed that the genome of truffles has evolved by a size expansion, mainly due to gypsy retrotransposons, in the common ancestor of Tuberaceae about 150 Mya. Then, a loss of the number of gene models, such as plant cell wall degrading enzymes occurred in the common ancestor of Tuber spp about 100 Mya. This study provides new insights into the evolution of the truffles, and ECM symbiosis in general, and highlights cases of divergence and convergence between Basidiomycota and truffle symbiotic species. A comparative analysis in T. melanosporum allowed characterizing a resource of more than 400,000 single nucleotide polymorphisms. This population genomic analysis allowed identifying candidate genomic regions with trace of selection. Finally, a more detailed characterization of T. melanosporum gypsy retrotransposons showed that the major invasive waves are old, but that more recently some elements have moved suggesting that retrotransposons continue to play an important role in the evolution of the truffle genome
|
66 |
Evolutionary genomics of conjugative elements and integrons / Génomique évolutive des éléments conjugués et des intégronsCury, Jean 17 November 2017 (has links)
Pas de résumé / No abstract
|
67 |
Evolution sous-clonale dans le neuroblastome / Subclonal evolution in neuroblastomaDeveau, Paul 27 June 2017 (has links)
Le neuroblastome est le cancer solide extra-cranial le plus fréquent chez l’enfant. Il est caractérisé par une très grande hétérogénéité tant au niveau clinique que moléculaire. Alors que certains patients rentrent spontanément en rémission, on peut se demander quels facteurs permettent la réémergence du cancer chez d’autres malgré traitement. Pour répondre à cette question, il convient d’identifier chez les patients ayant rechuté, les différentes populations clonales coexistant au diagnostic et/ou à la rechute. Cela permet, entre autre, d’étudier les voies différemment altérées entre ces deux temps. Dans cette optique, nous présentons ici QuantumClone, un algorithme de reconstruction clonal à partir de données de séquençage, ainsi que son application à une cohorte de patients souffrant d’un neuroblastome. Sur ces données, l’application de notre méthode a permis d’identifier des différences dans le ratio de variants prédits fonctionnels par rapport à ceux prédits passagers entre les populations ancestrales, enrichies à la rechute ou appauvries à la rechute. / Neuroblastoma is the most frequent solid extra-cranial cancer of childhood. This cancer displays a high heterogeneity both at clinical and molecular levels. Even though in some patients spontaneous remission can be observed, some others relapse despite treatment and surgical resection. It may be wondered which are the factors that distinguish these two cases. In order to answer this question, identification of populations coexisting at diagnosis and/or relapse in the patients which have relapsed is a prerequisite. This would allow, between other things, to study the pathways differently altered in clones that are specific to each time point. With this in mind, we hereby present QuantumClone, a clonal reconstruction algorithm from sequencing data. In addition, we applied this method to a cohort of patients suffering from neuroblastoma. On these data, our method identified differences in the functional mutation rate, i.e. the number of putative functional variants by total number of variants, between the ancestral clones, clones expanding at relapse, and clones shrinking at relapse.
|
68 |
Genomic evolution of archaea thermococcales / Évolution génomique chez les archée thermococcalesCossu, Matteo 26 January 2017 (has links)
L'objectif principal de mon projet de doctorat est d'étudier l'évolution génomique de l'ordre des Archaea Thermococcales. Je me suis intéressé à comprendre les mécanismes des éléments mobiles génétiques (MGE) pouvant influencer l'évolution des génomes. En utilisant une approche multidisciplinaire, nous avons pu explorer les différents aspects de ce phénomène in silico, in vitro et in vivo. Grâce à des analyses in silico de tous les génomes de Thermococcales complètement séquencés disponibles, nous avons montré que cet ordre affiche un niveau élevé de réarrangements pouvant perturber les modèles d'expression génique. Dans une première approche, nous avons étudié l'existence de l'organisation chromosomique. L'inefficacité dans la prédiction de l'origine et de la terminaison de la réplication sur la seule base de la composition de l'ADN chromosomique ou skew, nous a motivé à utiliser une approche différente basée sur des séquences biologiquement pertinentes. Nous avons donc déterminé la position de l'origine de la réplication (oriC) dans tous les 21 génomes séquencés Thermococcales. La position potentielle de la terminaison a été prédite dans 19 génomes à ou près du site dif, où les dimères chromosomiques sont résolus avant la ségrégation de l'ADN. Le calcul du génome central a révélé un certain nombre de grappes de gènes essentiels avec une position chromosomique remarquablement stable à travers les espèces, en utilisant oriC comme référence. D'autre part, les régions core-free semblent correspondre à des éléments mobiles intégrés putatifs. Ces observations indiquent qu'un degré remarquable d ' «ordre» a été maintenu à travers les Thermococcales, même s'ils présentent des chromosomes fortement brouillés, les inversions étant particulièrement fréquentes. La découverte et la caractérisation d'un nouvel organisme, Thermococcus nautili nous ont permis de mieux comprendre le mécanisme sous-jacent causant ces inversions. En effet, le séquençage et l'analyse in silico de son génome ont fortement suggéré l'implication d'une nouvelle classe de tyrosine recombinases dans la plasticité génomique. Le plasmide pTN3 de T. nautili, qui est intégré dans le chromosome et auto-réplicable, code une intégrase appartenant à la classe des tyrosine recombinases. Des plasmides similaires ont également été trouvés intégrés dans le chromosome d'autres séquences de Thermococcales (par exemple TKV4 dans T. kodakarensis). Afin de tester son activité enzymatique, l’integrase codée par le plasmide pTN3 a été surproduite et purifiée. Les expériences in vitro ont d'abord permis de déterminer le segment de séquence minimal requis pour l'activité de l'intégrase et optimisé la réaction enzymatique in vitro. Ces résultats nous ont permis, en suite, de démontrer la réaction d'excision / d'intégration observée avec d'autres recombinases de tyrosine. De plus, l'excision in vivo d'un élément intégré apparenté (TKV4 de T. kodakarensis) par l'intégrase pTN3 a été réalisée au cours de cette étude. Pour cela, le gène IntpTN3 a été clone dans un vecteur de la bactérie E. coli / Thermococcus pour la transformation et l'expression dans T. kodakarensis. Après incubation, les cellules ont montré la présence de l'élément TKV4-intégré dans la forme circulaire libre. Enfin, nous avons pu imiter l'inversion chromosomique in vitro en utilisant des substrats synthétiques contenant des séquences cibles d'intégration. Nous avons également pu montrer que l'intégrase pTN3 possède une activité qui peut intervenir sur des inversions génomiques à grande échelle en utilisant différents sites et donc expliquer les réarrangements observés dans Thermococcales (Cossu et al, in prep). / The main goal of my PhD project is to investigate the genomic evolution of the Archaea Thermococcales order. I am interested in understanding how mobile genetic elements (MGE) can influence the evolution of genomes. Using a multidisciplinary approach, we were able to explore the different aspects of this phenomenon in silico, in vitro and in vivo. Through in silico analyses of all available completely sequenced Thermococcales genomes, we showed that this order displays a characteristic high level of rearrangements potentially disrupting gene expression patterns. In a first approach, we investigated the existence of chromosomal organization. The inefficiency in predicting origin and termination of replication on the sole basis of chromosomal DNA composition or skew, motivated us to use a different approach based on biologically relevant sequences. We determined the position of the origin of replication (oriC) in all 21 sequenced Thermococcales genomes. The potential position of the termination was predicted in 19 genomes at or near the dif site, where chromosome dimers are resolved before DNA segregation. Computation of the core genome uncovered a number of essential gene clusters with a remarkably stable chromosomal position across species, using oriC as reference. On the other hand, core-free regions appear to correspond to putative integrated mobile elements. These observations indicate that a remarkable degree of “order” has been maintained across Thermococcales even if they display highly scrambled chromosomes, with inversions being especially frequent. The discovery and characterization of a new organism, Thermococcus nautili allowed us to better understand the underlying mechanism causing these inversions. The sequencing and in silico analysis of its genome strongly suggested the involvement of a new class of tyrosine recombinases in genomic plasticity. T. nautili pTN3 plasmid, which is found integrated into the chromosome and also self-replicating encodes an integrase belonging to this class. Similar plasmids have also been found integrated in the chromosome of other sequenced Thermococcales (e.g. TKV4 in T. kodakarensis). In order to test its enzymatic activity, we overproduced and purified the integrase encoded by pTN3. In vitro experiments first determined the minimal sequence segment required for integrase activity and optimized the enzymatic reaction in vitro. Due to this early results, we were able to demonstrate the excision/integration reaction observed with other tyrosine recombinases. Additionally, the in vivo excision of a related integrated element (TKV4 from T. kodakarensis) by the pTN3 integrase was performed during this study. The IntpTN3 gene has been cloned into an E. coli/Thermococcus shuttle vector for transformation and expression in T. kodakarensis. After incubation, cells showed the presence of the TKV4-integrated element in free circular form. Finally, we were able to mimic in vitro chromosomal inversion using synthetic substrates containing integration target sequences. We were also able to show that pTN3 integrase possesses an activity which can mediate large scale genomic inversions using different sites and therefore explain the rearrangements observed in Thermococcales).
|
69 |
The genomic history of horse domestication and management : an ancient DNA perspective / L’histoire génomique de la domestication et de l’utilisation du cheval décryptée par l’ADN ancienFages, Antoine 12 November 2018 (has links)
Parmi tous les animaux domestiques, le cheval est sans aucun doute celui ayant le plus influencé l’histoire des peuplements humains. Le cheval domestique a d’abord fourni à de nombreuses civilisations des ressources primaires essentielles telles que la viande et le lait. Utilisé pour sa force physique et comme moyen de transport, il a eu de profondes conséquences sur les mouvements de personnes et de biens ainsi que sur la diffusion de cultures et d’idées à travers l’Eurasie. Le cheval a ainsi fortement contribué à l’expansion de sociétés et d’empires pendant des millénaires, et ce jusqu’au vingtième siècle. Les différentes étapes de la domestication du cheval restent cependant mal comprises d’un point de vue archéologique et sont complexes à retracer à partir des données génétiques recueillies sur les races chevalines actuelles. L’émergence de la génomique ancienne au début des années 2010 a révolutionné la biologie de l'évolution, en donnant un accès direct à l’histoire des populations anciennes et actuelles. Elle est donc particulièrement adaptée pour étudier la transition historique induite par la domestication du cheval. En s'appuyant sur les dernières avancées en matière d’extraction d'ADN ancien et des technologies de séquençage d’ADN à haut débit, ce travail de doctorat vise à décrypter les modifications génétiques sous-jacentes au processus de domestication du cheval. Pour se faire, nous avons généré le plus grand jeu de données génomiques anciennes jamais rassemblées sur un organisme non humain. Celles-ci ont révélé que les chevaux domestiqués pour la première fois à Botai, dans le nord du Kazakhstan, il y a environ 5 500 ans, ne sont pas les ancêtres des chevaux domestiques ayant vécu pendant ces dernières ~4 100 années. Ce sont les ancêtres des chevaux de Przewalski, que l’on pensait jusqu’alors totalement sauvages. Cette découverte inattendue suggère qu'un remplacement majeur de la population de chevaux domestiques a eu lieu au cours du troisième millénaire avant notre ère, contribuant probablement à faire entrer l'humanité dans l'âge du Bronze. En outre, ces trois années de recherche ont permis d'identifier les signatures génétiques associées à différentes stratégies d’élevage du cheval et ont révélé les dynamiques évolutives en jeu lors des étapes clés de la domestication. En particulier, il ressort des analyses de génomes anciens que les chevaux ibériques n’ont contribué que marginalement à la création du cheval domestique tel qu’on le connaît aujourd'hui. Ce travail de thèse a par ailleurs permis de détecter une influence croissante des chevaux perses dès le début du Moyen Age. / Among all domesticates, the horse can confidently be considered as the animal that most impacted the history of human dynamics. Once they domesticated the horse, human civilizations got hold of essential domestication products including meat and milk, but also invaluable secondary products, such as fast transportation and powerful workforce. The horse thus deeply enhanced the circulation of people, goods, culture and ideas, promoting the spread of vast military and political units across Eurasia up until the 1900s. The various steps underpinning horse domestication are however difficult to track in the archaeological record and still poorly understood based on patterns of DNA variation among modern breeds. In the last decade, the advent of ancient genomics has revolutionized evolutionary biology by providing a direct window into the past history of populations. Ancient genomics therefore provides the necessary time travel machine to investigate the key historical transition in the history of humankind that was induced by the horse domestication. Leveraging the latest advances in ancient DNA recovery and High-Throughput sequencing technologies, this PhD project aimed at deciphering the genetic changes underlying the horse domestication process by generating the largest ancient genome dataset for a non-human organism, spanning the whole temporal and geographic range of horse domestication. This dataset revealed that horses first herded at Botai in Northern Kazakhstan ~5,500 years ago are not the ancestors of modern domestic horses but instead of modern Przewalski’s horses, previously thought to represent last true wild population on Earth. This major discovery also suggests that a swift genomic replacement in the domestic stock took place in the third millennium BCE, probably contributing to precipitating humankind into a new metal era, the Bronze Age. Additionally, this PhD work identified the genetic signatures associated with different management strategies and the evolutionary dynamics at play within distinct domestication stages. In particular, we were able to rule out Iberia as a major contributor to the modern domestic stock and moving towards more recent times, we characterized the growing influence of Persian-like horses starting in the early Middle Ages.
|
70 |
Analyse intégrative de données génomiques et pharmacologiques pour une meilleure prédiction de la réponse aux médicaments anti-cancer / Integrated analysis of genomic and pharmacological data to better predict anti-cancer drug responseFu, Yu 19 December 2016 (has links)
Analyse intégrative de données génomiques et pharmacologiques pour améliorer la prédiction de la réponse aux thérapies cibléesL'utilisation de thérapies ciblées dans le contexte de la médecine personnalisée du cancer a permis d’améliorer le traitement des patients dans différents types de cancer. Cependant, alors que la décision thérapeutique est basée sur une unique altération moléculaire (par exemple une mutation ou un changement du nombre de copies d’un gène), les tumeurs montrent différents degrés de réponse. Dans cette thèse, nous démontrons que la décision thérapeutique basée sur une unique altération n’est pas optimale et nous proposons un modèle mathématique intégrant des données génomiques et pharmacologiques pour identifier de nouveaux biomarqueurs prédictifs de la réponse thérapeutique. Le modèle a été construit à partir de deux bases de données de lignées cellulaires (the Genomics of Drug Sensitivity in Cancer, GDSC and the Cancer Cell Line Encyclopedia, CCLE) et validé avec des données de lignées et des données cliniques. De plus, nous avons également développé une nouvelle méthode pour améliorer la détection des mutations somatiques à partir de données de séquençage d'exomes complets et proposons un nouvel outil, cmDetect, disponible gratuitement pour la communauté scientifique. / Integrated analysis of genomic and pharmacological data to better predict the response to targeted therapiesThe use of targeted therapies in the context of cancer personalized medicine has shown great improvement of patients’ treatment in different cancer types. However, while the therapeutic decision is based on a single molecular alteration (for example a mutation or a gene copy number change), tumors will show different degrees of response. In this thesis, we demonstrate that a therapeutic decision based on a unique alteration is not optimal and we propose a mathematical model integrating genomic and pharmacological data to identify new single predictive biomarkers as well as combinations of biomarkers of therapy response. The model was trained using two public large-scale cell line data sets (the Genomics of Drug Sensitivity in Cancer, GDSC and the Cancer Cell Line Encyclopedia, CCLE) and validated with cell line and clinical data. Additionally, we also developed a new method for improving the detection of somatic mutations using whole exome sequencing data and propose a new tool, cmDetect, freely available to the scientific community.
|
Page generated in 0.0574 seconds