Return to search

Phylogenomic study of the evolutionary history of the Archaea and their link with eukaryogenesis / Étude phylogénomique de l'histoire évolutive des archées et de leur lien avec l'eucaryogenèse

L'explosion des données de séquençage a permis de résoudre la plupart des relations phylogénétiques chez les archées. Néanmoins, de nombreuses questions restent à résoudre à l'échelle du domaine des archées et à l'échelle des trois domaines du vivant. Parmi elles, les relations phylogénétiques au sein du cluster II, notamment la position des archées halophiles extrêmes qui ont été placées à différentes positions dans l'arbre en fonction des marqueurs et des modèles de reconstruction utilisés, ainsi que la position de la racine des archées et la position des eucaryotes à la lumière des lignées d'archées nouvellement séquencées. Au cours de ma thèse, j'ai contribué à (i) affiner la phylogénie du domaine des Archaea en se concentrant sur les relations phylogénétiques au sein du cluster II, en particulier les positions des lignées halophiles extrêmes par rapport aux méthanogènes à travers des analyses dédiées à cette partie spécifique de l'arbre, et (ii) établir une phylogénie globale des archées afin de comprendre leur histoire évolutive ancienne et leur lien avec les eucaryotes à travers une analyse phylogénomique en deux étapes à l'échelle des trois domaines du vivant. D'abord, en utilisant des approches de génomique comparée sur 155 génomes complets appartenant aux Halobacteria, Nanohaloarchaea, méthanogènes de classe II, Archaeoglobales et Diaforarchaea, j'ai identifié 258 protéines portant un signal phylogénétique fiable pour étudier les relations de parente au sein du cluster II. En combinant différentes approches limitant l'impact du signal non phylogénétique sur l'inférence phylogénétique (comme la méthode Slow-Fast et le recodage des acides aminés), j'ai montré que les Nanohaloarchaea branchent avec les Methanocellales et les Halobacteria branchent avec les Methanomicrobiales. Ce jeu de données a ensuite été utilisé pour étudier la position d'une troisième lignée halophile extrême, les Methanonatronarchaeia, qui se positionnent entre les Archaeoglobales et les Diaforarchaea. Ces résultats suggèrent que l'adaptation à la salinité extrême serait apparue au moins trois fois de manière indépendante chez les archées et que les similitudes phénotypiques observées chez les Nanohaloarchaea, Halobacteria et Methanonatronarchaeia résulteraient d'une convergence évolutive, éventuellement accompagnée de transferts de gènes horizontaux. Enfin, ces résultats suggèrent que le groupement basal des Nanohaloarchaea avec d'autres lignées des DPANN serait la conséquence d'un artefact de reconstruction. Pour la deuxième partie de ma thèse, j'ai appliqué une stratégie consistant à analyser séparément les trois domaines du vivant considérés deux à deux, en mettant à jour 72 familles protéiques précédemment identifiées par Raymann et ses collègues (2015) pour inclure toutes les nouvelles lignées d'archées séquencées depuis la publication de cette étude comme les Asgard, les DPANN, les Stygia, les Acherontia, etc. Au total, mon échantillonnage taxonomique comprend 435 archées, 18 eucaryotes et 67 bactéries. Les résultats des analyses par la méthode Slow-Fast soutiennent une racine des Archaea située entre le superphylum basal des DPANN et le reste des archées séparées en deux groupes monophylétiques : les cluster I et cluster II, comme décrits par Raymann et ses collègues (2015), et montrent que la monophylie des Euryarchaeota est liée aux positions évoluant vite. Mes résultats placent les eucaryotes en tant que groupe frère du superphylum des TACK et montrent que leur regroupement avec les Asgard est lié aux positions évoluant vite. Ces résultats ont des implications majeures sur les inférences de la nature du dernier ancêtre commun des archées et sur l'histoire évolutive de ce domaine qui a conduit à l'apparition de la première cellule eucaryote / The burst of sequencing data has helped disentangling most of the phylogenetic relationships in Archaea. Nevertheless, many questions remain to be addressed both at the level of the archaeal domain and at the level of the three domains of life. Among them, the phylogenetic relationships inside the cluster II, in particular the position of extreme halophilic archaeal lineages relatively to the methanogens which have been placed at different positions in the tree based on the different markers and reconstruction models used, as well as the position of the root of the Archaea and the position of the eukaryotes in the light of the newly sequenced archaeal lineages. During my thesis, I have contributed to (i) refine the phylogeny of the archaeal domain by focusing on the phylogenetic relationships among the cluster II Archaea, in particular the positions of the extreme halophilic lineages through dedicated analyses focusing on this specific part of the archaeal tree, and (ii) establish a global phylogeny of the Archaea to understand their early evolutionary history and their link with the eukaryotes through a large-scale two-step phylogenomic analysis at the level of the three domains of life. First, using comparative genomics approaches on 155 complete genomes belonging to the Halobacteria, Nanohaloarchaea, methanogens class II, Archaeoglobales, and Diaforarchaea, I have identified 258 proteins carrying a reliable phylogenetic signal to investigate the position of the extreme halophilic lineages in Archaea. By combining different approaches limiting the impact of non-phylogenetic signal on phylogenetic inference (like the Slow Fast method and the recoding of amino acids), I showed that the Nanohaloarchaea branch with Methanocellales, and Halobacteria branch with Methanomicrobiales. This dataset has been subsequently used to investigate the position of a third extreme halophilic lineage, the Methanonatronarchaeia, which I showed to branch in between the Archaeoglobales and Diaforarchaea. These results suggest that adaption to high salinity emerged at least three times independently in Archaea, and that the phenotypic similarities observed in Nanohaloarchaea, Halobacteria, and Methanonatronarchaeia likely result from convergent evolution, possibly accompanied by horizontal gene transfers. Finally, these results suggest that the basal grouping of Nanohaloarchaea with other DPANN lineages is likely the consequence of a tree reconstruction artefact. For the second part of my thesis, I have applied a strategy consisting in separately analyzing the three domains of life two by two, by updating 72 protein families previously identified by Raymann and colleagues (2015) to include all novel archaeal lineages that were sequenced since the publication of this study like the Asgard, the DPANN, the Stygia, the Acherontia, etc. In total, my taxonomic sampling includes 435 archaea, 18 eukaryotes, and 67 bacteria. The results of the Slow-Fast method supported a root of the Archaea lying between a basal DPANN superphylum and the rest of the Archaea separated into two monophyletic groups: the cluster I and cluster II as described by Raymann and colleagues (2015), and showed that the monophyly of the Euryarchaeota is supported only by the fast-evolving sites. My results also placed the eukaryotes as the sister group to the TACK superphylum and showed that their sister grouping with the Asgard is linked to the fast-evolving sites. These results have major implications on the inferences of the nature of the last common archaeal ancestor and the subsequent evolutionary history of this domain that led to the rise of the first eukaryotic cell

Identiferoai:union.ndltd.org:theses.fr/2018LYSE1246
Date13 November 2018
CreatorsAouad, Monique
ContributorsLyon, Brochier-Armanet, Céline, Gouy, Manolo
Source SetsDépôt national des thèses électroniques françaises
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.0025 seconds