1 |
Nucleotide Substitution Patterns in Vertebrate GenomesMugal, Carina Farah January 2013 (has links)
The rates and patterns at which nucleotide substitutions occur vary significantly across the genome sequence of vertebrates. A prominent example is the difference in the rate of evolution of functional sequences versus nonfunctional (neutrally evolving) sequences, which is explained by the influence of natural selection on functional sequences. However, even within neutrally evolving sequences there is striking variation in the rates and patterns of nucleotide substitutions. Unraveling the underlying processes that induce this variation is necessary to understand the basic principles of variation in neutral substitution profiles, which in turn is crucial for the identification of regions in the genome where natural selection acts. This research question builds the main focus of the present thesis. I have studied the causes and consequences of variation in different patterns of nucleotide substitutions. In particular, I have investigated substitutional strand asymmetries in mammalian genes and could show that they result from the asymmetric nature of DNA replication and transcription. Comparative analysis of substitutional asymmetries then suggested that the organization of DNA replication and the level of transcription are conserved among mammals. Further, I have examined the variation in CpG mutation rate among human genes and could show that beside DNA methylation also GC content plays a decisive role in CpG mutability. In addition, I have studied the signatures of GC-biased gene conversion and its impact on the evolution of the GC isochore structure in chicken. By comparison of the results in chicken to previous results in human I found evidence that karyotype stability is critical for the evolution of GC isochores. Finally, beside the empirical studies, I have performed theoretical investigations of substitution rates in functional sequences. More precisely, I have explored the temporal dynamics of estimates of the ratio of non-synonymous to synonymous substitution rates dN/dS in a phylogentic-population genetic framework.
|
2 |
Meiotic Recombination in Human and Dog : Targets, Consequences and Implications for Genome EvolutionBerglund, Jonas January 2014 (has links)
Understanding the mechanism of recombination has important implications for genome evolution and genomic variability. The work presented in this thesis studies the properties of recombination by investigating the effects it has on genome evolution in humans and dogs. Using alignments of human genes with chimpanzee and macaque orthologues we studied substitution patterns along the human lineage and scanned for evidence of positive selection. The properties mirror the situation in human non-coding sequences with the fixation bias ‘GC-biased gene conversion’ (gBGC) as a driving force in the most rapidly evolving regions. By assigning candidate genes to distinct classes of evolutionary forces we quantified the extent of those genes affected by gBGC to 20%. This suggests that human-specific characters can be prompted by the fixation bias of gBGC, which can be mistaken for selection. The gene PRDM9 controls recombination in most mammals, but is lacking in dogs. Using whole-genome alignments of dog with related species we examined the effects of PRDM9 inactivation. Additionally, we analyzed genomic variation in the genomes of several dog breeds. We identified that non-allelic homologous recombination (NAHR) via sequence identity, often GC-rich, creates structural variants of genomic regions. We show that these regions, which are also found in dog recombination hotspots, are a subset of unmethylated CpG-islands (CGIs). We inferred that CGIs have experienced a drastic increase in biased substitution rates, concurrent with a shift of recombination to target these regions. This enables recurrent episodes of gBGC to shape their distribution. The work presented in this thesis demonstrates the importance of meiotic recombination on patterns of molecular evolution and genomic variability in humans and dogs. Bioinformatic analyses identified mechanisms that regulate genome composition. gBGC is presented as an alternative to positive selection and is revealed as a major factor affecting allele configuration and the emergence of accelerated evolution on the human lineage. Characterization of recombination-induced sequence patterns highlights the potential of non-methylation and establishes unmethylated CGIs as targets of meiotic recombination in dogs. These observations describe recombination as an interesting process in genome evolution and provide further insights into the mechanisms of genomic variability.
|
3 |
The evolution of recombination and genomic structures : a modelling approach / L’évolution de la recombinaison et des structures génomiques : une approche par modélisationPopa, Alexandra-Mariela 24 May 2011 (has links)
La recombinaison méiotique joue un double rôle de moteur évolutif en participant à la création d'une diversité génétique soumise à la sélection naturelle et de contrôle dans la fabrication des gamètes lors de la méiose. De plus, en association avec certains mécanismes de réparation, la recombinaison, au travers de la conversion génique biaisée manipule les fréquences alléliques au sein des populations. Les connaissances sur le fonctionnement même de ce processus ont considérablement augmenté ces dernières années faisant découvrir un processus complexe, autant dans son fonctionnement que dans son évolution. Le thème général de la thèse est l'analyse, dans un contexte évolutif, des relations entre les différents rôles et caractéristiques fonctionnelles de la recombinaison. Un modèle de la recombinaison prenant en compte des contraintes liées au contrôle de la méiose et le phénomène d'interférence a permis une comparaison entre espèces au sein des vertébrés et des non-vertébrés de même qu'une comparaison entre sexes. Par ailleurs, nous avons montré l'impact de la localisation spécifique aux sexes des points chauds de recombinaison sur l'évolution du contenu en GC des génomes de plusieurs vertébrés. Finalement, nous proposons un modèle à l'échelle de la génétique des populations, permettant d'analyser l'impact de la recombinaison sur la fréquence de mutations délétères dans les populations humaines. Cette thèse, nous l'espérons, apportera sa pierre à l'étude interdisciplinaire de la recombinaison, à la fois au sein de la biologie et par ses relations au travers de la modélisation avec l'informatique et les mathématiques. / Meiotic recombination plays several critical roles in molecular evolution. First, recombination represents a key step in the production and transmission of gametes during meiosis. Second, recombination facilitates the impact of natural selection by shuffling genomic sequences. Furthermore, the action of certain repair mechanisms during recombination affects the frequencies of alleles in populations via biased gene conversion. Lately, the numerous advancements in the study of recombination have unraveled the complexity of this process regarding both its mechanisms and evolution. The main aim of this thesis is to analyze the relationships between the different causes, characteristics, and effects of recombination from an evolutionary perspective. First, we developed a model based on the control mechanisms of meiosis and inter-crossover interference. We further used this model to compare the recombination strategies in multiple vertebrates and invertebrates, as well as between sexes. Second, we studied the impact of the sex-specific localization of recombination hotspots on the evolution of the GC content for several vertebrates. Last, we built a population genetics model to analyze the impact of recombination on the frequency of deleterious mutation in the human population.
|
4 |
La conversion génique biaisée : origine, dynamique et intensité de la quatrième force d’évolution des génomes eucaryotes / Biased gene conversion : origin, dynamics and intensity of the fourth evolutionary force of eucaryotic genomesLesecque, Yann 11 July 2014 (has links)
En génomique comparative, on considère classiquement trois forces déterminant l'évolution des séquences : la mutation, la sélection et la dérive génétique. Récemment, lors de l'étude de l'origine évolutive des variations de la composition en base des génomes, un quatrième agent a été identifié : la conversion génique biaisée (BGC). Le BGC est intimement lié à la recombinaison méiotique et semble présent chez la plupart des eucaryotes. Ce phénomène introduit une surreprésentation de certains allèles dans les produits méiotiques aboutissant à une augmentation de la fréquence de ces variants dans la population. Ce processus est capable de mimer et d'interférer avec la sélection naturelle. Il est donc important de le caractériser afin de pouvoir le distinguer efficacement de la sélection dans l'étude de l'adaptation à l'échelle moléculaire. C'est ce que nous nous attachons à faire dans le cadre de ce travail. Pour cela nous utilisons deux espèces modèles. Premièrement la levure Saccharomyces cerevisiae pour laquelle une carte de recombinaison haute résolution permettant l'analyse du processus de conversion, est disponible. L'étude approfondie de cette carte nous a permis de lever le voile sur les mécanismes moléculaires qui sous-tendent le BGC. Deuxièmement, grâce à des découvertes récentes sur la détermination des patrons de recombinaison via la protéine PRDM9 chez les mammifères, nous avons quantifié la dynamique et l'intensité de ce processus dans l'histoire évolutive récente de l'homme. Ces résultats nous ont permis de confirmer la place du BGC comme quatrième force d'évolution moléculaire, mais aussi de discuter de l'origine évolutive de ce phénomène / Usually, three main forces are considered when studying sequences evolution in comparative genomics : mutation, selection and genetic drift. Recently, a fourth process has been identified during the study of base composition landscapes in genomes : biased gene conversion (BGC). This phenomenon introduces an overrepresentation of certain alleles in meiosis products (gametes or spores) leading to an increase of the frequency of those variants in the population. Thus, it is able to mimic and interfere with natural selection. Hence, it is important to describe this phenomenon in order to be able to trustfully distinguish BGC and selection in the study of adaptation at the molecular scale. So, the main goal of this work is to analyze the molecular origin, the intensity and the dynamics of BGC. To do so, we use two model species. First, we use the yeast Saccharomyces cerevisiae because, for this specie, a high-resolution recombination map is available which allows a fine study of the conversion process. Analyzing this map led us to shed the light on the molecular mechanisms of BGC. Secondly, recent discoveries on the role of the PRDM9 protein in the determination of recombination landscapes in mammals allowed us to quantify the dynamics and intensity of BGC in the recent human history. Thanks to those two studies, we first confirmed that BGC is the fourth force of molecular evolution and we also provided hypotheses about the evolutionary origin of this process
|
5 |
Comparative genomic and epigenomic analyses of human and non-human primate evolutionXu, Ke 12 January 2015 (has links)
Primates are one of the best characterized phylogenies with vast amounts of comparative data available, including genomic sequences, gene expression, and epigenetic modifications. Thus, they provide an ideal system to study sequence evolution, regulatory evolution, epigenetic evolution as well as their interplays. Comparative studies of primate genomes can also shed light on molecular basis of human-specific traits. This dissertation is mainly composed of three chapters studying human and non-human primate evolution. The first study investigated evolutionary rate difference between sex chromosome and autosomes across diverse primate species. The second study developed an unbiased approach without the need of prior information to identify genomic segments under accelerated evolution. The third study investigated interplay between genomic and epigenomic evolution of humans and chimpanzees.
Research advance 1: evolutionary rates of the X chromosome are predicted to be different from those of autosomes. A theory based on neutral mutation predicts that the X chromosome evolves slower than autosomes (slow-X evolution) because the numbers of cell division differ between spermatogenesis and oogenesis. A theory based on natural selection predicts an opposite direction (fast-X evolution) because newly arising beneficial mutations on the autosomes are usually recessive or partially recessive and not exposed to natural selection. A strong slow-X evolution is also predicted to counteract the effect of fast-X evolution. In our research, we simultaneously studied slow-X evolution, fast-X evolution as well as their interaction in a phylogeny of diverse primates. We showed that slow-X evolution exists in all the examined species, although their degrees differ, possibly due to their different life history traits such as generation times. We showed that fast-X evolution is lineage-specific and provided evidences that fast-X evolution is more evident in species with relatively weak slow-X evolution. We discussed potential contribution of various degrees of slow-X evolution on the conflicting population genetic inferences about human demography.
Research advance 2: human-specific traits have long been considered to reside in the genome. There has been a surge of interest to identify genomic regions with accelerated evolution rate in the human genome. However, these studies either rely on a priori knowledge or sliding windows of arbitrary sizes. My research provided an unbiased approach based on previously developed “maximal segment” algorithm to identify genomic segments with accelerated lineage-specific substitution rate. Under this framework, we identified a large number of human genomic segments with clustered human-specific substitutions (named “maximal segments” after the algorithm). Our identified human maximal segments cover a significant amount of previously identified human accelerated regions and overlap with genes enriched in developmental processes. We demonstrated that the underlying evolutionary forces driving the maximal segments included regionally increased mutation rate, biased gene conversion and positive selection.
Research advance 3: DNA methylation is one of the most common epigenetic modifications and plays a significant role in gene regulation. How DNA methylation status varies on the evolutionary timescale is not well understood. In this study, we investigated the role of genetic changes in shaping DNA methylation divergence between humans and chimpanzees in their sperm and brain, separately. We find that for orthologous promoter regions, CpG dinucleotide content difference is negatively correlated with DNA methylation level difference in the sperm but not in the brain, which may be explained by the fact that CpG depleting mutations better reflect germline DNA methylation levels. For the aligned sites of orthologous promoter regions, sequence divergence is positively correlated with methylation divergence for both tissues. We showed that the evolution of DNA methylation can be affected by various genetic factors including transposable element insertions, CpG depleting mutations and CpG generating mutations.
|
6 |
La recombinaison comme moteur de l’évolution des génomes : caractérisation de la conversion génique biaisée chez la souris / Recombination as a driver of genome evolution : characterisation of biased gene conversion in miceGautier, Maud 25 September 2019 (has links)
Au cours de la méiose, les points chauds de recombinaison sont le siège de la formation de cassures double-brin de l’ADN. Ces dernières sont ensuite réparées par un processus qui, chez de nombreuses espèces, favorise la transmission des allèles G et C : la conversion génique biaisée vers GC (gBGC). L’intensité de cet important distorteur de la ségrégation méiotique varie fortement entre espèces mais les facteurs déterminant son évolution sont toujours inconnus. Nous avons donc voulu quantifier directement le biais de transmission chez la souris et comparer les paramètres dont il dépend avec d’autres mammifères. Dans cette étude, en couplant des développements bioinformatiques à une technique de capture ciblée d’ADN suivie de séquençage haut-débit (capture-seq), nous avons réussi à mettre au point une approche qui s’est révélée 100 fois plus performante pour détecter les événements de recombinaison que les méthodes existant actuellement. Ainsi, nous avons pu identifier 18 821 crossing-overs (COs) et non-crossovers (NCOs) à très grande résolution chez des individus uniques, ce qui nous a permis de caractériser minutieusement la recombinaison chez la souris. Chez cette espèce, les points chauds de recombinaison sont ciblés par la protéine PRDM9 et sont donc soumis à une deuxième forme de conversion génique biaisée (BGC) : le biais d’initiation (dBGC). La quantification du dBGC et du gBGC à partir de nos données nous a permis de mettre en lumière le fait que, au moment où des populations structurées s’hybrident, le gBGC des lignées parentales est propagé par un phénomène d’auto-stop génétique (genetic hitchhiking) provenant du dBGC. Nous avons ensuite pu observer que, chez les souris mâles, seuls les NCOs — et plus particulièrement les NCOs contenant un seul marqueur génétique— contribuent à l’intensité du gBGC. En comparaison, chez l’Homme, à la fois les NCOs et au moins une part des COs (ceux qui présentent des tracts de conversion complexes) distordent les fréquences alléliques. Ceci suggère que la machinerie de réparation des cassures double-brin qui induit le biais de conversion génique (BGC) présente des variations au sein des mammifères. Nos résultats sont aussi en accord avec l’hypothèse selon laquelle une pression de sélection limiterait l’intensité de ce processus délétère à l’échelle de la population. Cela se traduirait par une compensation de la taille efficace de population à de multiples niveaux : par le taux de recombinaison, par la longueur des tracts de conversion et par le biais de transmission. Somme toute, notre travail a permis de mieux comprendre la façon dont la recombinaison et la conversion génique biaisée opèrent chez les mammifères. / During meiosis, recombination hotspots host the formation of DNA double-strand breaks (DSBs). DSBs are subsequently repaired through a process which, in a wide range of species, is biased towards the favoured transmission of G and C alleles: GC-biased gene conversion (gBGC). The intensity of this fundamental distorter of meiotic segregation strongly varies between species but the factors dictating its evolution are not known. We thus aimed at directly quantifying the transmission bias in mice and comparing the parameters on which it depends with other mammals. Here, we coupled capture-seq and bioinformatic techniques to implement an approach that proved 100 times more powerful than current methods to detect recombination. With it, we identified 18,821 crossing-over (CO) and non-crossover (NCO) events at very high resolution in single individuals and could thus precisely characterise patterns of recombination in mice. In this species, recombination hotspots are targeted by PRDM9 and are therefore subject to a second type of biased gene conversion (BGC): DSB-induced BGC (dBGC). Quantifying both dBGC and gBGC with our data brought to light the fact that, in cases of structured populations, past gBGC from the parental lineages is hitchhiked by dBGC when the populations cross. We next observed that, in male mice, only NCOs — and more particularly single-marker NCOs — contribute to the intensity of gBGC. In contrast, in humans, both NCOs and at least a portion of COs (those with complex conversion tracts) distort allelic frequencies. This suggests that the DSB repair machinery leading to gBGC varies across mammals. Our findings are also consistent with the hypothesis of a selective pressure restraining the intensity of the deleterious gBGC process at the population-scale: this would materialise through a multi-level compensation of the effective population size by the recombination rate, the length of conversion tracts and the transmission bias. Altogether, our work has allowed to better comprehend how recombination and biased gene conversion proceed in the mammalian clade
|
7 |
Phylogénomique et stratégies d'histoires de vie des mammifères placentaires : apports de la théorie de la conversion génique biaisée / Phylogenomic and life-history strategies of placental mammals : insights of the biased gene conversion theoryRomiguier, Jonathan 22 November 2012 (has links)
Des souris aux baleines en passant par les humains, la diversité écologique des mammifères placentaires est des plus fascinantes. Bien qu'il s'agisse là d'un des groupes les plus étudiés, leur origine fait pourtant l'objet de bien des mystères. Leurs relations de parenté les plus basales restent en effet incertaines, et l'on ignore encore beaucoup du mode de vie qu'avaient nos ancêtres du Crétacé, ces mammifères placentaires qui auraient côtoyé les dinosaures pendant plus de 30 millions d'années.Afin d'aborder ces questions, cette thèse a utilisé l'outil de la génomique comparative. L'une de ses principales originalités est la prise en compte d'un distorteur majeur de notre évolution moléculaire: la conversion génique biaisée. Truquant la loterie génétique, ce mécanisme associé à la recombinaison méiotique avantage les nucléotides G et C au détriment des nucléotides A et T. Façonnés par son influence, nos paysages nucléotidiques présentent ainsi ponctuellement des taux de GC anormalement élevés.Jusque là, ce phénomène n'avait été étudié que chez une poignée d'organismes modèles. Son analyse chez plus d'une trentaine de génomes mammaliens a mis en évidence une série de résultats clés. En particulier, l'évolution du contenu en GC des gènes s'est avéré dépendre de la masse corporelle et la longévité des espèces. E nreliant ainsi évolution moléculaire et traits d'histoire de vie, des reconstructions de séquences ancestrales ont permis d'estimer la durée de vie des premiers mammifères placentaires à plus de 25 ans. Cette longévité va bien au delà de ce que peuvent espérer atteindre les souris ou musaraignes actuelles, des animaux au mode de vie pourtant jusqu'ici supposé comme étant proche de celui de nos ancêtres.Parallèlement à ces résultats, une tendance à produire des phylogénies inexactes a été détectée chez les gènes les plus GC-riches. Moins soumis à la conversion génique biaisée, les gènes AT-riches se sont montrés plus fiables, tout en soutenant que les espèces originaires d'Afrique sont situés à la base de l'arbre des placentaires. Ce résultat suggère ainsi la possible résolution d'un des noeuds les plus controversés de notre histoire évolutive.Du simple nucléotide à la naissance d'une infraclasse de plus de 4000espèces, ce travail révèle comment l'évolution moléculaire peut porter un nouveau regard sur nos origines les plus profondes. / From mice to whales through humans, placental mammals present astunning diversity. Despite being one of the most studied group ever,mysteries persist about their origin. Indeed, their most basalrelationships still remain uncertain, and nothing is really knownabout the lifestyle of our cretaceous ancestors, these placentalmammals which lived side by side with non-avian dinosaurs during 30My.To answer these evolutionnary questions, comparative genomic studiesof placental mammals have been conducted. One of its originalities isto take into account biased gene conversion. Rigging the geneticlottery, this recombination-associated mechanism involves a reparationbias favouring the G and C nucleotides over the A and T ones, whichmark the mammalian genomic landscapes by inducing localized peaks ofGC-content.This phenomenon has been so far studied in few model species. Theexploration of biased gene conversion in more than 30 mammal genomesled to several key results. In particular, GC content evolution hasproved to be correlated to the longevity and the body mass of species.By linking together molecular evolution and life history traits, thereconstruction of ancestral sequences allowed us to estimate alife-span above 25 years for early placental mammals. This value ismarkedly different from that of mice or shrews, although our mammalianancestors have often been represented as such. In addition to these results, GC-rich genes were found to be prone toproduce false phylogenies. Less affected by recombination associatedartifacts, AT-rich genes are shown to be more reliable, and to supportspecies of African origin as the sister group of all other placentalmammals - perhaps resolving one of the most controversial nodes of themammalian tree.From nucleotide to the birth of a 4,000 species infraclass, this workreveals how molecular evolution can shed new light onour deepest origins.
|
8 |
Évolution des îlots CpG chez les primates / Evolution of CpG islands in PrimatesGuillet-Renard, Claire 07 October 2009 (has links)
Cette thèse a pour l’objet l’étude des pressions de sélection qui s’appliquent sur les îlots CpG, courtes séquences génomiques qui échappent à la méthylation chez les mammifères. Nous avons tout d’abord étudié les caractéristiques génomiques des îlots CpG, notamment leurs liens avec l’initiation de transcription des gènes et les origines de réplication de l’ADN, en utilisant des jeux de données récemment publiés. Nous avons ensuite déterminé si les caractéristiques de séquence des îlots CpG (richesse en dinucléotides CpG et richesse en GC) étaient sous pression de sélection et pouvaient jouer un rôle dans les fonctions des îlots CpG. Nous avons montré que la richesse relative en dinucléotides CpG des îlots CpG résulte uniquement de la faible méthylation de ces séquences. De plus, la richesse en bases GC des îlots CpG n’est pas soumise à pression de sélection mais semble résulter d’un mécanisme neutre, la conversion génique biaisée vers GC. Nous discutons également du devenir des îlots CpG chez les primates, qui et avons montré que si le taux de GC de ces séquences est en train de diminuer, la richesse relative en CpG quant à elle reste stable / This thesis analyses selective pressures applying on CpG islands, short sequences which escape methylation in mammalian genomes. We first studied genomic characteristics of CpG islands. We namely studied their relationships with gene transcription start, and with DNA replication origins, using recently published data. We then determined wether base peculiar composition of CpG islands (high number of CpG dinucleotides, high GC content) may be under (negative or positive) selective pressures, and thus play a role in their function, or not. We showed that the relative CpG-richness of CpG islands is the mere consequence of the low methylation of these genomic regions. Moreover, we showed that the high GC content of CpG islands is not under selective pressures, and seem to result from a neutral mechanism, biased gene conversion toward GC. We also discussed the future of CpG islands and primates. We showed that the GC content of CpG islands is decreasing, while the relative CpG content remains constant
|
9 |
Estimation et analyse du taux de substitution adaptatif chez les animaux / Estimation and analysis of the adaptive substitution rate in animalsRousselle, Marjolaine 26 November 2018 (has links)
Comprendre les déterminants du taux d’adaptation est une question primordiale en évolution moléculaire. En particulier, l’influence de la taille efficace de population sur la sélection positive, ainsi que la nature des changements d’acides aminés qui mènent à de l’adaptation sont des questions encore débattues. Pour y répondre, la méthode DFE-α, dérivée du test fondateur de McDonald & Kreitman, est un outil puissant pour mesurer le taux de substitution adaptatif. Elle est néanmoins sensible à certains biais. Au cours de cette thèse, nous avons identifié deux biais majeurs de cette méthode, les fluctuations de long-terme du régime de sélection-dérive via des fluctuations démographiques, et la conversion génique biaisée vers GC (gBGC). Via des simulations, nous avons montré que divers scénarios plausibles de fluctuations démographiques peuvent mener à une sur-estimation du taux de substitution adaptatif. Nous avons aussi obtenu des indications empiriques que le régime de sélection-dérive récent ne reflète pas le régime de sélection-dérive de long-terme chez diverses espèces animales, ce qui représente une violation d’une hypothèse forte de la méthode DFE-α. D’autre part, nous avons montré que la gBGC entraîne une sur-estimation du taux de substitution adaptatif chez les primates et les oiseaux. Via un jeu de données de neuf taxons de métazoaires et un total de 40 espèces, nous avons d’une part initié une analyse visant à identifier la nature des changements d’acides aminés qui mènent à l’adaptation, et montré que les changements radicaux sont soumis à une plus forte sélection purificatrice que les changements conservatifs. D’autre part, nous avons pu évaluer le lien entre la taille efficace et le taux de substitution adaptatif tout en prenant en compte les deux sources de biais explorées précédemment. Nous avons mis en évidence pour la première fois une relation négative entre le taux de substitution adaptatif et des traits d’histoire de vie représentatifs de la taille de population de long-terme. Ce résultat va à l’encontre de l’hypothèse canonique d’une adaptation plus efficace en grandes populations. / Understanding the determinants of the adaptive substitution rate is a central question inmolecular evolution. In particular, the influence of the effective population size N e on positiveselection as well as the nature of amino acid changes that lead to adaptation are still debated. TheDFE-α method, which was derived from the seminal McDonald & Kreitman test, is a powerful toolfor estimating the adaptive substitution rate. However, it is sensitive to various sources of bias. Inthis thesis, we identified two major sources of bias of this test, long-term fluctuations of theselective-drift regime through demographic fluctuations, and GC-biased gene conversion (gBGC).Using simulations, we showed that under plausible scenarios of fluctuating demography, the DFE-αmethod can lead to a severe over-estimation of the adaptive substitution rate. We also showed thatpolymorphism data reflect a transient selective-drift regime which is unlikely to correspond to theaverage regime experienced by genes and genomes during the long-term divergence betweenspecies. This violates an important assumption of the DFE-α method. Our results also indicate thatgBGC leads to an over-estimation of the adaptive substitution rate in primates and birds. Using adataset of nine metazoan taxa for a total of 40 species, we started an analysis aiming at identifyingthe type of amino acid changes that are more prone to adaptation, and evaluated the link between N eand the adaptive substitution rate while accounting for the two sources of bias previously explored.We reveal for the first time a negative relationship between the adaptive substitution rate and life-history traits representative of long-term N e . This result is in contradiction with the widespreadhypothesis that adaptation is more efficient in large populations.
|
10 |
Diversité et évolution des paysages nucléotidiques des plantes / Diversity and Evolution of Nucleotide Landscapes in PlantsSerres-Giardi, Laurana 28 June 2012 (has links)
Le paysage nucléotidique – la manière dont la composition nucléotidique varie le long du génome – est une caractéristique marquante de l'organisation des génomes et varie fortement entre espèces. Plusieurs hypothèses émergent des nombreux débats autour des mécanismes évolutifs à l'origine de ces hétérogénéités du taux de GC, parmi lesquelles la conversion génique biaisée vers G et C (BGC) et la sélection sur l'usage du code (SUC). La BGC est un processus neutre associé à la recombinaison qui favorise les allèles en G ou C au détriment des allèles en A ou T. La SUC est une force de sélection qui favorise les codons dits « préférés », ceux dont la traduction serait la plus efficace. Contrairement à ceux des vertébrés, les paysages nucléotidiques des plantes sont peu connus. La plupart des études ont été consacrées au génome d'Arabidopsis thaliana, pauvre en GC et homogène, et à celui du riz, riche en GC et hétérogène. Le contraste entre ces deux génomes a souvent été généralisé comme une dichotomie entre dicotylédones et monocotylédones, mais cette vision est clairement phylogénétiquement biaisée.Les objectifs de ce travail de thèse sont de caractériser les paysages nucléotidiques des angiospermes à une large échelle phylogénétique et de mieux comprendre quels sont les mécanismes évolutifs jouant sur l'évolution de ces paysages nucléotidiques. Comment varient les paysages nucléotidiques le long de la phylogénie des angiospermes ? SUC et BGC façonnent-elles ces paysages nucléotidiques ? Les différents taxons sont-ils affectés avec la même intensité ?Pour répondre à ces questions, j'ai utilisé une approche de génomique comparative basée sur l'analyse de données EST chez plus de 230 espèces d'angiospermes et de gymnospermes. L'exploration des paysages nucléotidiques de ce large éventail de plantes a montré que les patrons d'hétérogénéité des paysages nucléotidiques suivent un continuum le long de la phylogénie, avec des groupes particulièrement riches et hétérogènes en GC, les graminées par exemple. Mes résultats suggèrent que les paysages nucléotidiques des plantes pourraient avoir été façonnés par la BGC et, dans une moindre mesure, par la SUC. Des épisodes indépendants d'enrichissement et d'appauvrissement en GC ont vraisemblablement eu lieu au cours de l'évolution des plantes, et pourraient être expliqués par des variations d'intensité de ces mécanismes. En utilisant une prédiction du degré d'expression des EST, j'ai également mis en évidence une diversité dans les codons préférés entre espèces. Les préférences d'usage des codons se sont révélées plus labiles au cours de l'évolution pour les codons des acides aminés au code quatre et six fois dégénéré. J'ai pu lier l'évolution des préférences d'usage des codons à l'évolution de la composition nucléotidique des génomes. Mes résultats suggèrent que la composition en base des génomes, affectée en partie par la BGC, orienterait la coévolution entre préférence d'usage du code et ARNt. / The nucleotide landscape – the way base composition varies along a genome – is a striking feature of genome organization and is highly variable between species. The evolutionary causes of such heterogeneity in GC content have been much debated. Biased gene conversion towards G and C (BGC) and selection on codon usage (SCU) are thought to be main forces. BGC is a neutral process associated with recombination favouring G and C alleles over A and T ones. SCU is a selection process favouring the so-called “preferred” codons, i.e., those whose translation is the most efficient. Contrary to vertebrates, plant nucleotide landscapes are still poorly known. Most studies focused on the GC-poor and homogeneous Arabidopsis thaliana genome and on the GC-rich and heterogeneous rice genome. The contrast between these two genomes was often generalized as a dicot/monocot dichotomy but this vision is clearly phylogenetically biased.The objectives of this study are to characterize angiosperm nucleotide landscapes on a wide phylogenetic scale and to better understand the evolutionary mechanisms acting upon the evolution of nucleotide landscapes. To what extent do nucleotide landscapes vary across angiosperm phylogeny? Are nucleotide landscapes shaped by BGC and SCU? Are taxa affected with the same intensity?To tackle these issues, I used a comparative genomic approach relying on EST data analysis on over 230 angiosperm and gymnosperm species. Through the nucleotide landscape survey for such a wide range of species I found a continuum of GC-heterogeneity patterns across phylogeny, some taxa such as Poaceae being strikingly GC-rich and heterogeneous. My results suggest that nucleotide landscapes could have been shaped by BGC and, to a lesser extent, by SCU. GC-content enrichment and impoverishment are likely to have occurred several times independently during plant evolution and could be explained by intensity variations of BGC and SCU. Using a proxy for EST expression level, I also characterized the diversity of preferred codons between species. Codon usage preferences were shown to be evolutionarily more unstable for four- and six-fold degenerate codon families. Finally, I could link the evolution of codon usage preferences to the evolution of genome base composition. My results suggest that genome base composition, partially shaped by BGC, seems to drive the coevolution between codon usage preferences and tRNAs.
|
Page generated in 0.1111 seconds