Les génomes des eucaryotes et des procaryotes évoluent de temps en temps par un processus complexe, impliquant entre autres, des événements évolutifs tels que les spéciations, les duplications, les transferts horizontaux, et les pertes de gènes. Nous étudions ici les méthodes de réconciliation, une technique bien connue pour inférer de tels événements et retrouver leur localisation dans l'histoire d'espèces. En effet, ces méthodes construisent une correspondance entre l'histoire d'une famille de gènes (l'arbre de gènes) et l'histoire des espèces contenant ces gènes (l'arbre d'espèces) pour expliquer leurs discordances sur la base d'événements évolutifs qu'elles infèrent et positionnent sur l'arbre de gènes et l'arbre d'espèces. Les méthodes de réconciliation sont appliquées dans plusieurs domaines tels que l'étude de l'évolution du génome; l'inférence des relations d'orthologies en évolution moléculaire; l'étude de la coévolution entre hôtes et parasites en écologie, ou encore l'étude des zones de population en biogéographie. Les trois principales contributions de cette thèse sont les suivantes : premièrement, un outil nommé SEAS est proposé pour simuler l'évolution des familles de gènes dans une phylogénie d'espèces donnée. Cela permet d'obtenir des arbres de gènes synthétiques dont la réconciliation est connue et qui permettent donc d'évaluer la précision des méthodes de réconciliation. Deuxièmement, une méthode heuristique, appelée MowgliNNI, est proposée pour corriger les arbres de gènes partiellement erronés au regard des réconciliations. Cette méthode itérative réarrange les branches faiblement supportées pour rechercher une nouvelle topologie de l'arbre de gènes, dont le coût de réconciliation est moindre. Troisièmement, nous proposons une approche pour estimer la fiabilité des événements évolutifs prédits par les méthodes de réconciliation. Contrairement aux approches existantes qui ne considèrent qu'une des réconciliations optimales possible entre l'arbre de gènes et l'arbre d'espèces, notre approche prend en compte un ensemble de solutions optimales voire sous-optimales. En outre, nous introduisons le concept de réconciliations médianes symétriques et asymétriques qui servent d'éléments centraux pour représenter un ensemble de réconciliations. Nous présentons un algorithme pour calculer ces réconciliations médianes qui est en temps polynomial bien que l'ensemble de toutes les réconciliations optimales est potentiellement exponentiel. Des expériences ont été réalisées pour montrer l'exactitude, la signification et l'efficacité de nos méthodes proposées. / The genomes of eukaryotes and prokaryotes evolve over time through a complex process involving, among other things, evolutionary events such as speciations, duplications, horizontal transfers, and losses of genes. We study here reconciliation methods, a well-known technique for recovering such events as well as locating them along the species history. Indeed, reconciliation methods construct a mapping between a gene family history (a gene tree) and a species history (a species tree) to explain their incongruence thanks to the inferred evolutionary events located on both the gene and species trees. Reconciliation methods can be applied to various areas such as the study of genome evolution, the inference of orthology relationships in molecular evolution, the study of host-parasite coevolution in ecology, or the study of population areas in biogeography. The three main contributions of this thesis are as follows: First, we provide a tool, named SEAS, for simulating the evolution of gene families along a given species phylogeny. This provides synthetic gene trees along with their known reconciliations that are helpful to evaluate the accuracy of reconciliation methods. Second, we propose a heuristic method, called MowgliNNI, to correct partly erroneous gene trees based on reconciliation scores. This method iteratively rearranges the weakly supported parts of a gene tree as long as it improves the reconciliation score. Third, we propose effective solutions for estimating the reliability of the predicted evolutionary events. Unlike the currently existing approaches considering only the optimal solutions for reconciling a pair of species-gene trees, our approach additionally takes into account the nearly optimal solutions. Furthermore, we introduce the concept of symmetric and asymmetric median reconciliations, which serve as central elements to represent a set of reconciliations. We present a polynomial time algorithm computing such median reconciliations from the potentially exponential set of all optimal reconciliations for a given pair of species-gene trees. Experiments have been carried on to show the correctness, meaningfulness and effectiveness of our proposed methods.
Identifer | oai:union.ndltd.org:theses.fr/2013MON20141 |
Date | 03 October 2013 |
Creators | Nguyen Thi, Hau |
Contributors | Montpellier 2, Ranwez, Vincent, Berry, Vincent |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0022 seconds