L'évolution moléculaire procède par divergence depuis un ancêtre commun et en combinant des fragments d'objets évoluant d'origines différentes, par des processus introgressifs. Les transferts horizontaux de gènes sont probablement les plus connus de ces processus, mais l'introgression affecte aussi d'autres niveaux d'organisation biologique. Ainsi, la plupart des objets biologiques évoluant peuvent être composés de parties d'origines phylogénétiques différentes et décrits comme composites. Cette évolution modulaire se modélise mal par des arbres, puisque les objets composites ne sont pas seulement le résultat d'une divergence depuis un ancêtre. Les réseaux sont bien plus aptes à modéliser la modularité, et la théorie des graphes peut être utilisée pour chercher dans ces réseaux des patrons caractéristiques d'une évolution réticulée. Pendant cette thèse, j'ai développé le logiciel CompositeSearch qui détecte les gènes composites dans des jeux de données de séquences massifs, jusqu'à plusieurs millions de séquences. Cet algorithme a été utilisé pour identifier et quantifier l'abondance des gènes composites dans des environnements de sols pollués ainsi que dans les plasmides. Les résultats montrent que d'importantes adaptations et nouveautés biologiques découlent de processus œuvrant au niveau subgénique. De plus, les réseaux fournissent un cadre conceptuel dont l'utilité va bien au-delà de l'évolution moléculaire et je les ai appliqués à d'autres objets évoluant, comme les animaux (réseaux de traits morphologiques) et les langues (réseaux de mots). Dans les deux cas, la modularité se révèle être une conséquence évolutive majeure, et obéit à des règles encore à préciser. / Molecular evolution proceeds not only by divergence from a common ancestor, but also by combining parts from evolving objects of different origins, through processes that are called introgressive. Lateral gene transfers are probably the most well-known of these processes, but introgression has been shown to also happen at various levels of biological organization. As a result, most biological evolving objects (genes, genomes, communities) can be composed of parts from different phylogenetic origins and can be described as composites. Such modular evolution is inadequately modeled by trees, since composite objects are not merely the result of divergence from a common ancestor only. Networks on the other hand are much more suited for handling modularity, and graph theory can be used to search networks for patterns that are characteristic of such reticulate evolution. During this PhD, I developed a piece of software, CompositeSearch, that can efficiently detect composite genes in massive sequence dataset, comprising up to millions of sequences. This algorithm was used to identify and quantify the abundance of composite genes in polluted soil environments, and in prokaryotic plasmids. These studies show that important biological novelties and adaptations can result from processes acting at subgenic levels. However, as shown in this manuscript, networks provide a framework that goes well beyond the boundaries of molecular evolution and I have applied them to other evolving entities, such as animals (trait networks) morphology and languages (word networks). In both cases, modularity appears to be a major evolutionary outcome, following rules that remain to be investigated.
Identifer | oai:union.ndltd.org:theses.fr/2017PA066277 |
Date | 23 October 2017 |
Creators | Pathmanathan, Jananan |
Contributors | Paris 6, Bapteste, Éric, Lopez, Philippe |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0017 seconds