Global ETD Search

21	Analyse bioinformatique des protéines BCL-2 et développement de la base de connaissance dédiée, BCL2DB / Bioinformatic analysis of BCL-2 proteins and development of the dedicated knowledge database, BCL2DB Rech de Laval, Valentine 11 December 2013 (has links) Les protéines BCL-2 jouent un rôle essentiel dans la décision de vie ou de mort des cellules. Elles contrôlent l'induction de l'apoptose (mort cellulaire programmée) par la voie mitochondriale via des fonctions opposées de régulateurs anti- et pro-apoptotiques. Les protéines contenant un ou plusieurs domaines dits d'homologie à Bcl-2 (BHl- 4) sont systématiquement classées dans cette famille. Grâce à une analyse bioinformatique et phylogénétique, nous avons revisité les différents critères d'inclusion dans le groupe de protéines BCL-2 et proposé une nouvelle classification tenant compte des données structurales et évolutives. Cette nouvelle nomenclature distingue : un premier groupe de protéines homologues (dérivant d'un ancêtre commun), partageant une structure 3D semblable à celle de Bcl-2 et pouvant ne posséder aucun motif BH, et un conglomérat, en pleine expansion, regroupant des protéines sans lien phylogénétique apparent et partageant une courte région de similarité de séquence correspondant au motif BH3. Sur la base de ces résultats, nous avons construit un processus, basé sur des profils HMM, pour identifier les protéines appartenant au groupe de protéines BCL-2. Notre processus automatisé est utilisé pour i) récupérer les séquences nucléotidiques et protéiques mensuellement ii) les annoter et iii) les intégrer dans la base de connaissances BCL2DB (« The BCL-2 Database »). Celle-ci est accessible via une interface Web (http://bcl2db.ibcp.fr) qui permet aux chercheurs d'extraire des données et d'effectuer des analyses de séquence / BCL-2 proteins play an essential role in the decision of life or death of animal cells. They control the induction of apoptosis (programmed cell death) in the mitochondrial pathway via regulators having opposite functions: anti- or pro-apoptotic. Proteins containing one or more Bcl-2 homology domains (BHl-4) are systematically classified in this family. Through bioinformatics and phylogenetic analysis, we revisited the different criteria for protein inclusion in the BCL-2 group and proposed a new classification taking into account structural and evolutionary data. This new nomenclature distinguishes a first group of homologous proteins (derived from a common ancestor), sharing a similar 3D structural fold with Bcl-2 and often (but not necessarily) having one or more BH motifs, and a fast expanding conglomerate of proteins without apparent phylogenetic relationships and sharing only a short region of sequence similarity corresponding to the BH3 motif. Based on these results, we built a process based on profiles HMM to identify proteins belonging to the BCL-2 protein group. Our automated process i) recovers on a monthly basis the nucleotide and protein sequences ii) annotates them and iii) integrates this information into BCL2DB ("The BCL-2 Database"). This resource can be accessed via a web interface (http://bcl2db.ibcp.fr) which allows researchers to extract data and perform sequence analysis Famille BCL-2 Motifs Protéiques Base de données Apoptose Évolution moléculaire BCL-2 family Protein motifs Database Apoptosis Molecular evolution 570.15
22	Évolution moléculaire : un modèle Markov-modulé pour les processus de substitution Fournier, Eric 01 1900 (has links) Les processus Markoviens continus en temps sont largement utilisés pour tenter d’expliquer l’évolution des séquences protéiques et nucléotidiques le long des phylogénies. Des modèles probabilistes reposant sur de telles hypothèses sont conçus pour satisfaire la non-homogénéité spatiale des contraintes fonctionnelles et environnementales agissant sur celles-ci. Récemment, des modèles Markov-modulés ont été introduits pour décrire les changements temporels dans les taux d’évolution site-spécifiques (hétérotachie). Des études ont d’autre part démontré que non seulement la force mais également la nature de la contrainte sélective agissant sur un site peut varier à travers le temps. Ici nous proposons de prendre en charge cette réalité évolutive avec un modèle Markov-modulé pour les protéines sous lequel les sites sont autorisés à modifier leurs préférences en acides aminés au cours du temps. L’estimation a posteriori des différents paramètres modulants du noyau stochastique avec les méthodes de Monte Carlo est un défi de taille que nous avons su relever partiellement grâce à la programmation parallèle. Des réglages computationnels sont par ailleurs envisagés pour accélérer la convergence vers l’optimum global de ce paysage multidimensionnel relativement complexe. Qualitativement, notre modèle semble être capable de saisir des signaux d’hétérogénéité temporelle à partir d’un jeu de données dont l’histoire évolutive est reconnue pour être riche en changements de régimes substitutionnels. Des tests de performance suggèrent de plus qu’il serait mieux ajusté aux données qu’un modèle équivalent homogène en temps. Néanmoins, les histoires substitutionnelles tirées de la distribution postérieure sont bruitées et restent difficilement interprétables du point de vue biologique. / Time-continuous Markovian process are widely used to understand the mechanism of nucleotidic acids and proteins evolution along phylogeny. Already existing probabilistic models based on such hypothesis are designed to satisfy the non-homogeneity of functional and environmental constraints acting across those biological sequences. Recently, Markov-modulated models have been introduced to describe site-specific temporal rate variation (heterotachy). Moreover, studies have demonstrated that not only strength but also the nature of the constraint acting on a specific site can vary over time. Here we propose to accommodate this evolutionary reality with a Markov-modulated model for proteins under which sites are authorized to change their amino acids propensities across time. Posterior estimation of the stochastic kernel hidden parameters with Monte Carlo methods is a challenging approach that we partially overcome with parallel computing. Fine-tuning are otherwise planned to accelerate convergence toward the target posterior stationnary distribution. Qualitatively, our model seems to be able to capture temporal heterogeneity from real sequences data sets whose evolutionary history is assumed to be rich in substitutional switch events. Furthermore, evaluation of the model performance suggest that he provides a better fit to the data set than the time-homogeneous equivalent model. Nonetheless, substitutional histories sampled from the posterior distribution are quite noisy and remain difficult to interpret biologically. Évolution moléculaire Inférence Bayésienne Processus de substitution Modèle Markov-modulé Molecular evolution Bayesian inference substitution process Markov-modulated model
23	Recherche automatisée de motifs dans les arbres phylogénétiques / Automatic phylogenetic tree pattern matching Bigot, Thomas 05 June 2013 (has links) La phylogénie permet de reconstituer l'histoire évolutive de séquences ainsi que des espèces qui les portent. Les récents progrès des méthodes de séquençage ont permis une inflation du nombre de séquences disponibles et donc du nombre d'arbres de gènes qu'il est possible de construire. La question qui se pose est alors d'optimiser la recherche d'informations dans ces arbres. Cette recherche doit être à la fois exhaustive et efficace. Pour ce faire, mon travail de thèse a consisté en l'écriture puis en l'utilisation d'un ensemble de programmes capables de parcourir et d'annoter les arbres phylogénétiques. Cet ensemble de programmes porte le nom de TPMS (Tree Pattern Matching Suite). Le premier de ces programmes (tpms_query) permet d'effectuer l'interrogation de collections à l'aide d'un formalisme dédie. Les possibilités qu'il offre sont : La détection de transferts horizontaux : Si un arbre de gènes présente une espèce branchée dans un arbre au milieu d'un groupe monophylétique d'espèces avec lesquelles elle n'est pas apparentée, on peut supposer qu'il s'agit d'un transfert horizontal, si ces organismes sont des procaryotes ou des eucaryotes unicellulaires. La détection d'orthologie : Si une partie d'un arbre de gènes correspond exactement à l'arbre des espèces, on peut alors supposer que ces gènes sont un ensemble de gènes d'orthologues. La validation de phylogénies connues : Quand l'arbre des espèces donne lieu à des débats, il peut est possible d'interroger une large collection d'arbres de gènes pour voir combien de familles de gènes correspondent à chaque hypothèse. Un autre programme, tpms_computations, permet d'effectuer des opérations en parallèle sur tous les arbres, et propose notamment l'enracinement automatique des arbres via différents critères, ainsi que l'extraction de sous arbres d'orthologues (séquence unique par espèce). Il propose aussi une méthode de détection automatique d'incongruences. La thèse présente le contexte, les différents algorithmes à la base de ces programmes, ainsi que plusieurs utilisations qui en ont été faites / Phylogeny allows to reconstruct evolutionnary history of sequences and species that carry them. Recent progress in sequencing methods produced a growing number of available sequences, and so of number of gene trees that one can build. One of the consecutive issues is to optimise the extraction of information from the trees. Such an extraction should be complete and efficient. To address this, my thesis consisted in writing and then using a suite of programs which aim to browse and annotate phylogenic trees. This program suite is named TPMS (Tree Pattern Matching Suite). It browses and annotates trees with several algorithms. The first of them, tpms_query consists in querying collections using a dedicated formalism. This allows to: Detect horizontal transfers If, in a gene tree, a species is nested in a monophyletic group of unrelated species, one can infer this is a horizontal transfer, if this organisms are prokaryotic (also concerning some unicellular eukaryotes). Orthology detection: if a part of a gene tree exactly matches to the species tree, one can suppose these genes are set of orthologues. Validating known phylogenies: when controversy exists concerning the species tree, it is possible to query a lange collection of gene trees to perform a count of families matching to each hypothesis. Another program allows to perform parallel operations on all the trees, such as automating rooting of trees via different criterions. It also allows an automatic detection of incongruencies. The thesis introduces the context, different algorithms which the programs are based on, and several using performed with it Évolution moléculaire Bioinformatique Phylogénie Tree pattern matching Enracinement Transfert horizontal Orthologie Incongruence Evolutionnary biology Bioinformatics Phylogeny Tree pattern matching Rooting Horizontal gene transfer Orthology Incongruency 570.285
24	La conversion génique biaisée : origine, dynamique et intensité de la quatrième force d’évolution des génomes eucaryotes / Biased gene conversion : origin, dynamics and intensity of the fourth evolutionary force of eucaryotic genomes Lesecque, Yann 11 July 2014 (has links) En génomique comparative, on considère classiquement trois forces déterminant l'évolution des séquences : la mutation, la sélection et la dérive génétique. Récemment, lors de l'étude de l'origine évolutive des variations de la composition en base des génomes, un quatrième agent a été identifié : la conversion génique biaisée (BGC). Le BGC est intimement lié à la recombinaison méiotique et semble présent chez la plupart des eucaryotes. Ce phénomène introduit une surreprésentation de certains allèles dans les produits méiotiques aboutissant à une augmentation de la fréquence de ces variants dans la population. Ce processus est capable de mimer et d'interférer avec la sélection naturelle. Il est donc important de le caractériser afin de pouvoir le distinguer efficacement de la sélection dans l'étude de l'adaptation à l'échelle moléculaire. C'est ce que nous nous attachons à faire dans le cadre de ce travail. Pour cela nous utilisons deux espèces modèles. Premièrement la levure Saccharomyces cerevisiae pour laquelle une carte de recombinaison haute résolution permettant l'analyse du processus de conversion, est disponible. L'étude approfondie de cette carte nous a permis de lever le voile sur les mécanismes moléculaires qui sous-tendent le BGC. Deuxièmement, grâce à des découvertes récentes sur la détermination des patrons de recombinaison via la protéine PRDM9 chez les mammifères, nous avons quantifié la dynamique et l'intensité de ce processus dans l'histoire évolutive récente de l'homme. Ces résultats nous ont permis de confirmer la place du BGC comme quatrième force d'évolution moléculaire, mais aussi de discuter de l'origine évolutive de ce phénomène / Usually, three main forces are considered when studying sequences evolution in comparative genomics : mutation, selection and genetic drift. Recently, a fourth process has been identified during the study of base composition landscapes in genomes : biased gene conversion (BGC). This phenomenon introduces an overrepresentation of certain alleles in meiosis products (gametes or spores) leading to an increase of the frequency of those variants in the population. Thus, it is able to mimic and interfere with natural selection. Hence, it is important to describe this phenomenon in order to be able to trustfully distinguish BGC and selection in the study of adaptation at the molecular scale. So, the main goal of this work is to analyze the molecular origin, the intensity and the dynamics of BGC. To do so, we use two model species. First, we use the yeast Saccharomyces cerevisiae because, for this specie, a high-resolution recombination map is available which allows a fine study of the conversion process. Analyzing this map led us to shed the light on the molecular mechanisms of BGC. Secondly, recent discoveries on the role of the PRDM9 protein in the determination of recombination landscapes in mammals allowed us to quantify the dynamics and intensity of BGC in the recent human history. Thanks to those two studies, we first confirmed that BGC is the fourth force of molecular evolution and we also provided hypotheses about the evolutionary origin of this process Conversion génique biaisée Évolution moléculaire Génome Crossing-Overs PRDM9 Recombinaison Mismatch repair Points chauds Biased gene conversion Molecular evolution Genome Crossing-Overs PRDM9 Recombination Mismatch repair Hotspots 572.8
25	Evolution du développement de l’œil chez le poisson cavernicole aveugle Astyanax mexicanus / Evolution of Eye Development in the Blind Cavefish Astyanax Mexicanus Hinaux, Hélène 16 June 2014 (has links) Le poisson Astyanax mexicanus présente, au sein de la même espèce, plusieurs populations de poissons de rivières (SF) et de poissons de grottes aveugles (CF). Chez les poisons cavernicoles aveugles, les yeux se développent presque normalement pendant l’embryogenèse. Mais 24 heures après la fécondation (hpf), quand l’embryon éclot, le cristallin entre en apoptose, ce qui déclenche la dégénérescence progressive de l’œil entier. Mon projet de thèse visait à comprendre le mécanisme conduisant à l’apoptose du cristallin, jusqu’alors totalement incompris, en partant du postulat selon lequel le défaut devait avoir lieu pendant les stades précoces du développement du cristallin. Le cristallin se développe à partir d’une placode, un épaississement de l’ectoderme au stade neurula. Toutes les placodes, qui donnent naissance à des organes des sens de la tête, sont issues du champ panplacodal, situé à la bordure de la plaque neurale antérieure à 10 hpf. Nous avons comparé la régionalisation de ce champ chez les deux morphes, par hybridations in situ de gènes marqueurs des différentes placodes. Chez le CF, le territoire présomptif du cristallin est réduit à 10 hpf, et le cristallin est plus petit à tous les stades étudiés. D’autre part, la placode olfactive est étendue, et donne naissance à un épithélium olfactif plus large chez le CF. Les modifications de taille de ces deux placodes pourraient être le résultat évolutif d’un « trade-off » entre ces deux composantes sensorielles. La régionalisation modifiée du champ panplacodal chez le CF est due au moins partiellement à des différences spatiales et temporelles d’expression des molécules de signalisation Shh, Fgf, et peut-être Bmp4.Nous avons pensé que la petite taille du cristallin pouvait être la cause directe de son entrée en apoptose, par un défaut d’effet de communauté. Nous avons réalisé une ablation laser partielle des cellules précurseurs du cristallin à 12-14 hpf chez l’embryon SF, mimant ainsi la taille du cristallin CF. L’apoptose dans le petit cristallin des larves SF à 60 hpf n’a pas été augmentée, ce qui montre que la petite taille n’est pas suffisante pour induire l’apoptose.L’apoptose du cristallin pourrait aussi provenir de défauts de morphogenèse ou d’un problème de lignage cellulaire. Nous utilisons donc l’imagerie biphoton in vivo sur des embryons SF et CF, de 10 à 24 hpf, préalablement injectés au stade une cellule avec des ARNm de H2B-mCherry et Ras-GFP pour marquer les noyaux et les membranes. Les premiers résultats sur les poissons de surface montrent que nous pouvons suivre à rebours les cellules du cristallin de la fin du film jusqu’au champ panplacodal, et étudier la morphogenèse et les divisions.La différenciation du cristallin est également affectée chez le CF : au moins 5 cristallines, qui sont des protéines structurales du cristallin, ne sont pas exprimées correctement chez le CF, d’après des hybridations in situ et des qPCR. Cependant, le rôle fonctionnel de deux de ces modifications d’expression a été testé, et individuellement, elles n’expliquent pas le phénotype apoptotique. Nous émettons l’hypothèse qu’une combinaison de défauts d’expression de plusieurs cristallines serait à l’origine de l’apoptose du cristallin CF. Enfin, et plus largement, les forces évolutives qui ont conduit à la perte de l’œil chez Astyanax mexicanus ne sont pas encore comprises. Par une étude d’évolution moléculaire à l’échelle du transcriptome nous avons identifié des mutations fixées entre SF et CF, et avons pu mettre en évidence une accumulation de mutations dans des « gènes d’yeux » chez les CF. Cela suggère un relâchement de la pression de sélection sur ces gènes, peut-être devenus inutiles dans l’obscurité. De même, les séquences des cristallines de CF paraissent accumuler des mutations fixées à un taux élevé vu leur bas niveau de polymorphisme. / The fish Astyanax mexicanus presents, within the same species, several populations of river-dwelling surface fish (SF) and blind cave-living fish (CF). In blind cavefish, the eyes first develop almost normally during embryogenesis. But 24 hours after fertilization (hpf), when the embryo hatches, the lens enters apoptosis, which triggers the progressive degeneration of the entire eye. My thesis project aimed at understanding the mechanism leading to lens apoptosis, which was so far unknown. We reasoned that the defect(s) should take place during the early stages of lens development. The lens develops from a placode, a thickening of the ectoderm at the neurula stage. All placodes, giving rise to sense organs of the head, originate from the “panplacodal” field, located at the border of the anterior neural plate at 10 hpf. We compared the patterning of the panplacodal field in the 2 morphs, using in situ hybridizations for placodal marker genes. In CF, the lens placode territory is reduced at 10 hpf, and the lens is smaller at all stages examined. Conversely, the olfactory placode is enlarged, and gives rise to a bigger olfactory epithelium in CF. The modifications in size of these two placodes could result evolutionarily from a trade-off between these two sensory components. Developmentally, the modified patterning of the panplacodal field in CF is at least partly due to the spatial and temporal differences in the expression of Shh and Fgf (and perhaps Bmp4) signaling molecules.We hypothesized that the small size of the lens could be the direct cause of its apoptosis, through a lack of community effect. We performed partial laser ablation of lens precursor cells at 12-14hpf in surface fish (thereby mimicking the CF lens size). Apoptosis in the resulting small lens of SF larvae at 60hpf was not enhanced, showing that small size is not sufficient to induce apoptosis. Lens apoptosis could also result from morphogenesis defects or from a problem in cell lineage. We are performing two-photon live imaging, from 10 to 24 hpf, of SF and CF embryos previously injected at the one cell stage with H2B-mCherry and Ras-GFP mRNAs to label nuclei and membranes. First results on surface fish show that we can back-track lens cells to the panplacodal field, and follow morphogenesis and divisions. Lens differentiation is also affected in cavefish: at least 5 crystallins, which are lens structural components, are not expressed correctly in CF, based on in situ hybridization and qPCR data. However the functional role of two of these expression modifications / losses was tested and, individually, they don’t seem to explain the apoptosis phenotype. We propose that a combination of several crystallins expression defects would explain CF lens apoptosis.Finally, and more globally, evolutionary forces that led to eye loss in Astyanax mexicanus are not yet understood. Through a transcriptome-wide molecular evolution approach, we identified fixed mutations in transcripts between SF and CF, and we could show an accumulation of mutations in “eye genes” in CF. This suggests that the selection is relaxed on these genes, that have maybe become useless in the dark. Similarly, CF crystallin sequences seem to accumulate fixed mutations at a high rate, considering their low polymorphism level. Cristallin Apoptose Évolution moléculaire Cristallines Forces évolutives Transcriptome Imagerie in vivo Biologie du développement Placodes Signalisation Lens Apoptosis Molecular evolution Crystallins Evolutionary forces Transcriptome Live imaging Developmental biology Placodes Signaling
26	Optimisation de potentiels statistiques pour un modèle d'évolution soumis à des contraintes structurales Bonnard, Cécile 05 January 2010 (has links) (PDF) Ces dernières années, plusieurs modèles d'évolution moléculaire, basés sur l'hypothèse que les séquences des protéines évoluent sous la contrainte d'une structure bien dénie et constante au cours de l'évolution, ont été développés. Cependant, un tel modèle repose sur l'expression de la fonction repr ésentant le lien entre la structure et sa séquence. Les potentiels statistiques proposent une solution intéressante, mais parmi l'ensemble des potentiels statistiques existants, lequel serait le plus approprié pour ces modèles d'évolution ? Dans cette thèse est développé un cadre probabiliste d'optimisation de potentiels statistiques, dans le contexte du maximum de vraisemblance, et dans une optique de protein design. Le potentiel statistique utilisé ici est composé d'un terme de contact entre deux acides aminés et un terme d'accessibilité au solvant, mais le cadre statistique peut être très facilement généralisé à des formes plus complexes de potentiel. Ce cadre intègre diérentes méthodes d'optimisation, incluant la prise en compte de structures alternatives (decoys) pour l'optimisation des potentiels, et utilise une amélioration algorithmique permettant l'obtention rapide de potentiels statistiques adaptés au contexte. Tout cela nous fournit un cadre robuste et des tests statistiques (à la fois dans le contexte de l'optimisation des potentiels et dans le contexte de l'évolution moléculaire), permettant de comparer diérentes méthodes d'optimisation de potentiels statistiques pour les modèles soumis à des contraintes structurales. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre [SDV:OT] Life Sciences/Other [SDV:OT] Sciences du Vivant/Autre potentiels statistiques évolution moléculaire optimisation structure des protéines
27	Évolution moléculaire : un modèle Markov-modulé pour les processus de substitution Fournier, Eric 01 1900 (has links) Les processus Markoviens continus en temps sont largement utilisés pour tenter d’expliquer l’évolution des séquences protéiques et nucléotidiques le long des phylogénies. Des modèles probabilistes reposant sur de telles hypothèses sont conçus pour satisfaire la non-homogénéité spatiale des contraintes fonctionnelles et environnementales agissant sur celles-ci. Récemment, des modèles Markov-modulés ont été introduits pour décrire les changements temporels dans les taux d’évolution site-spécifiques (hétérotachie). Des études ont d’autre part démontré que non seulement la force mais également la nature de la contrainte sélective agissant sur un site peut varier à travers le temps. Ici nous proposons de prendre en charge cette réalité évolutive avec un modèle Markov-modulé pour les protéines sous lequel les sites sont autorisés à modifier leurs préférences en acides aminés au cours du temps. L’estimation a posteriori des différents paramètres modulants du noyau stochastique avec les méthodes de Monte Carlo est un défi de taille que nous avons su relever partiellement grâce à la programmation parallèle. Des réglages computationnels sont par ailleurs envisagés pour accélérer la convergence vers l’optimum global de ce paysage multidimensionnel relativement complexe. Qualitativement, notre modèle semble être capable de saisir des signaux d’hétérogénéité temporelle à partir d’un jeu de données dont l’histoire évolutive est reconnue pour être riche en changements de régimes substitutionnels. Des tests de performance suggèrent de plus qu’il serait mieux ajusté aux données qu’un modèle équivalent homogène en temps. Néanmoins, les histoires substitutionnelles tirées de la distribution postérieure sont bruitées et restent difficilement interprétables du point de vue biologique. / Time-continuous Markovian process are widely used to understand the mechanism of nucleotidic acids and proteins evolution along phylogeny. Already existing probabilistic models based on such hypothesis are designed to satisfy the non-homogeneity of functional and environmental constraints acting across those biological sequences. Recently, Markov-modulated models have been introduced to describe site-specific temporal rate variation (heterotachy). Moreover, studies have demonstrated that not only strength but also the nature of the constraint acting on a specific site can vary over time. Here we propose to accommodate this evolutionary reality with a Markov-modulated model for proteins under which sites are authorized to change their amino acids propensities across time. Posterior estimation of the stochastic kernel hidden parameters with Monte Carlo methods is a challenging approach that we partially overcome with parallel computing. Fine-tuning are otherwise planned to accelerate convergence toward the target posterior stationnary distribution. Qualitatively, our model seems to be able to capture temporal heterogeneity from real sequences data sets whose evolutionary history is assumed to be rich in substitutional switch events. Furthermore, evaluation of the model performance suggest that he provides a better fit to the data set than the time-homogeneous equivalent model. Nonetheless, substitutional histories sampled from the posterior distribution are quite noisy and remain difficult to interpret biologically. Évolution moléculaire Inférence Bayésienne Processus de substitution Modèle Markov-modulé Molecular evolution Bayesian inference substitution process Markov-modulated model
28	Impact génomique des stratégies d'histoire de vie et reconstruction de traits ancestraux chez les amniotes / Genomic impact of life-history strategies and ancestral trait reconstruction in amniots Figuet, Emeric 17 December 2015 (has links) L'élucidation des liens réciproques unissant le génotype et le phénotype constitue un objectif central de la biologie moderne. De nombreux aspects de l'évolution à l'échelle moléculaire sont ainsi connus pour répondre aux caractéristiques démographiques ou d'histoire de vie des espèces. En particulier, la théorie quasi-neutre postule que les petites populations accumulent davantage de substitutions faiblement délétères dans leur génome, en raison d'une dérive génétique accrue. La composition en bases, à travers le mécanisme de la conversion génique biaisée, s'est également révélée obéir à l'influence de paramètres macroscopiques. Cependant, l'élaboration et la vérification empirique de ces théories se sont bien souvent fondées sur une gamme limitée de groupes d'organismes, incluant principalement les mammifères. Dans cette thèse, sur la base de l'étude comparative de plusieurs dizaines de transcriptomes, nous avons étendu à l'échelle des amniotes la compréhension des déterminants des patrons moléculaires observés. Grâce à l'analyse simultanée des principaux clades de reptiles, oiseaux et mammifères, nous avons pu confirmer et généraliser le rôle majeur de la taille efficace des populations sur la capacité des espèces à purger les changements d'amino-acide désavantageux, tout en exhibant un comportement inattendu du ratio dN/dS chez les oiseaux – soulevant au passage une énigme stimulante. La conversion génique biaisée est apparue comme le principal moteur de l'évolution du taux de GC des séquences codantes chez les vertébrés, y compris chez les reptiles et les poissons, dont la composition génomique homogène en avait masqué l'action. En parallèle, l'exploitation des relations entre traits d'histoire de vie et paramètres moléculaires nous a permis de réaliser de nouvelles avancées concernant l'objectif de reconstruction des masses ancestrales, pour lequel nous nous sommes focalisés sur l'ordre des cétartiodactyles, qui se caractérise aujourd'hui par une majorité de grosses espèces (comme le chameau, la girafe ou les cétacés). L'analyse combinée du marqueur mitochondrial, encore jamais testé, et des marqueurs nucléaires, incluant une vingtaine de transcriptomes nouvellement séquencés, a témoigné en faveur du résultat singulier d'un ancêtre cétartiodactyle de petite taille, comme suggéré par la paléontologie, démontrant ainsi le potentiel prometteur des données de séquence à dévoiler le passé des organismes. / Understanding the reciprocal influence between genotype and phenotype has been a long-standing goal of modern biology. Many aspects of evolution at the molecular level are well known to respond to demographic or life history characteristics of species. In particular, the nearly-neutral theory postulates that small populations accumulate a heavier load of slightly deleterious substitutions in their genome as a result of increased genetic drift. Base composition has also been shown to reflect the influence of macroscopic parameters through the mechanism of GC-biased gene conversion. However, the development and empirical validation of these theories are mostly based on a restricted diversity of organisms, in which mammals stand as a major contributor. In this thesis, using a comparative approach and tens of transcriptomes, we aimed at extending to Amniota our understanding of the determinants of molecular evolutionary patterns. With the incorporation of all clades of reptiles, we confirmed the major role of the effective population size on species ability to purge deleterious amino-acid changes, while revealing a paradoxical response of the dN/dS ratio in birds, raising a stimulating enigma. The biased gene conversion also emerged as the main driver of coding sequence GC content in vertebrates, including reptiles and fishes, whose genomic homogeneity had kept its signal hidden for long. In parallel, the relations between life-history traits and molecular parameters have enabled us to investigate and make progress in the field of ancestral body mass reconstruction. We focused on the Cetartiodactyla order, a group which is mainly characterized by large extant species (such as camel, giraffe or whales). The combined analysis of the yet untested mitochondrial marker and nuclear genes, including 21 newly sequenced transcriptomes, testified in favor of the singular result of a small cetartiodactyl ancestor, in agreement with the palaeontological record, demonstrating the strong potential of DNA sequences to reveal the past of organisms. Taille efficace des populations Évolution moléculaire Masse corporelle Cétartiodactyle Génomique comparative Caractère ancestral Effective population size Molecular evolution Body mass Cetartiodactyla Comparative genomic Ancestral state
29	Phylogénomique des Archées Grenier, Jean-Christophe 07 1900 (has links) Les transferts horizontaux de gènes (THG) ont été démontrés pour jouer un rôle important dans l'évolution des procaryotes. Leur impact a été le sujet de débats intenses, ceux-ci allant même jusqu'à l'abandon de l'arbre des espèces. Selon certaines études, un signal historique dominant est présent chez les procaryotes, puisque les transmissions horizontales stables et fonctionnelles semblent beaucoup plus rares que les transmissions verticales (des dizaines contre des milliards). Cependant, l'effet cumulatif des THG est non-négligeable et peut potentiellement affecter l'inférence phylogénétique. Conséquemment, la plupart des chercheurs basent leurs inférences phylogénétiques sur un faible nombre de gènes rarement transférés, comme les protéines ribosomales. Ceux-ci n'accordent cependant pas autant d'importance au modèle d'évolution utilisé, même s'il a été démontré que celui-ci est important lorsqu'il est question de résoudre certaines divergences entre ancêtres d'espèces, comme pour les animaux par exemple. Dans ce mémoire, nous avons utilisé des simulations et analyser des jeux de données d'Archées afin d'étudier l'impact relatif des THG ainsi que l'impact des modèles d'évolution sur la précision phylogénétique. Nos simulations prouvent que (1) les THG ont un impact limité sur les phylogénies, considérant un taux de transferts réaliste et que (2) l'approche super-matrice est plus précise que l'approche super-arbre. Nous avons également observé que les modèles complexes expliquent non seulement mieux les données que les modèles standards, mais peuvent avoir un impact direct sur différents groupes phylogénétiques et sur la robustesse de l'arbre obtenu. Nos résultats contredisent une publication récente proposant que les Thaumarchaeota apparaissent à la base de l'arbre des Archées. / Horizontal gene transfer (HGT) had been demonstrated to play an important role in the evolution of prokaryotes. Their impact on phylogeny was the subject of a heated debate, with some proposing that the concept of a species tree should be abandoned. The phylogeny of prokaryotes does contain a major part of the historical signal, because stable and functional horizontal transmissions appear to be by far rarer than vertical transmissions (tens versus billions). However, the cumulative effect of HGT is non-negligible and can potentially affect phylogenetic inference. Therefore, most researchers base their phylogenetic inference on a low number of rarely transferred genes such as ribosomal proteins, but they assume the selection of the model of evolution as less important, this despite the fact that it has been shown of prime importance for much less deep divergences, e.g. like animals. Here, we used a combination of simulations and of real data from Archaea to study the relative impact of HGT and of the inference methods on the phylogenetic accuracy. Our simulations prove that (1) HGTs have a limited impact on phylogeny, assuming a realistic rate and (2) the supermatrix is much more accurate than the supertree approach. We also observed that more complex models of evolution not only have a better fit to the data, but can also have a direct impact on different phylogenetic groups and on the robustness of the tree. Our results are in contradiction to a recent publication proposing that the Thaumarchaeota are at the base of the Archaeal tree. phylogénie phylogeny phylogénomique phylogenomics procaryotes prokaryotes Archées Archaea transfert horizontal de gènes horizontal gene transfer évolution moléculaire molecular evolution simulations simulation modèles évolutifs evolutionary models super-matrice supermatrix super-arbre supertree
30	Statistical potentials for evolutionary studies Kleinman, Claudia L. 06 1900 (has links) Les séquences protéiques naturelles sont le résultat net de l’interaction entre les mécanismes de mutation, de sélection naturelle et de dérive stochastique au cours des temps évolutifs. Les modèles probabilistes d’évolution moléculaire qui tiennent compte de ces différents facteurs ont été substantiellement améliorés au cours des dernières années. En particulier, ont été proposés des modèles incorporant explicitement la structure des protéines et les interdépendances entre sites, ainsi que les outils statistiques pour évaluer la performance de ces modèles. Toutefois, en dépit des avancées significatives dans cette direction, seules des représentations très simplifiées de la structure protéique ont été utilisées jusqu’à présent. Dans ce contexte, le sujet général de cette thèse est la modélisation de la structure tridimensionnelle des protéines, en tenant compte des limitations pratiques imposées par l’utilisation de méthodes phylogénétiques très gourmandes en temps de calcul. Dans un premier temps, une méthode statistique générale est présentée, visant à optimiser les paramètres d’un potentiel statistique (qui est une pseudo-énergie mesurant la compatibilité séquence-structure). La forme fonctionnelle du potentiel est par la suite raffinée, en augmentant le niveau de détails dans la description structurale sans alourdir les coûts computationnels. Plusieurs éléments structuraux sont explorés : interactions entre pairs de résidus, accessibilité au solvant, conformation de la chaîne principale et flexibilité. Les potentiels sont ensuite inclus dans un modèle d’évolution et leur performance est évaluée en termes d’ajustement statistique à des données réelles, et contrastée avec des modèles d’évolution standards. Finalement, le nouveau modèle structurellement contraint ainsi obtenu est utilisé pour mieux comprendre les relations entre niveau d’expression des gènes et sélection et conservation de leur séquence protéique. / Protein sequences are the net result of the interplay of mutation, natural selection and stochastic variation. Probabilistic models of molecular evolution accounting for these processes have been substantially improved over the last years. In particular, models that explicitly incorporate protein structure and site interdependencies have recently been developed, as well as statistical tools for assessing their performance. Despite major advances in this direction, only simple representations of protein structure have been used so far. In this context, the main theme of this dissertation has been the modeling of three-dimensional protein structure for evolutionary studies, taking into account the limitations imposed by computationally demanding phylogenetic methods. First, a general statistical framework for optimizing the parameters of a statistical potential (an energy-like scoring system for sequence-structure compatibility) is presented. The functional form of the potential is then refined, increasing the detail of structural description without inflating computational costs. Always at the residue-level, several structural elements are investigated: pairwise distance interactions, solvent accessibility, backbone conformation and flexibility of the residues. The potentials are then included into an evolutionary model and their performance is assessed in terms of model fit, compared to standard evolutionary models. Finally, this new structurally constrained phylogenetic model is used to better understand the selective forces behind the differences in conservation found in genes of very different expression levels. Évolution moléculaire structure des protéines Markov chain Monte Carlo maximum de vraisemblance statistique Bayesienne potentiels statistiques molecular evolution protein structure Markov chain Monte Carlo maximum likelihood Bayesian statistics statistical potentials

Search results