Spelling suggestions: "subject:"arbor phylogénétique""
11 |
Investigating the Impact of Insertion Sequences on the Evolution of Prokaryotic Genomes / Etude de l’Impact des séquences d’Insertion sur l’évolution des énomes ProcaryotesAl-Nayyef, Huda 15 December 2015 (has links)
Le nombre de génomes bactériens et archées complètement séquencés augmentant sans cesse plus, une telle augmentation rend possible le développement de nouveaux types d’approches large échelle, afin de comprendre l’évolution de la structure des génomes au cours du temps. La prédiction du contenu en gènes et la comparaison des génomes ont évolué de telle sorte qu’il est dorénavant possible d’extraire un certain nombre de nouvelles information permettant de comprendre l’évolution des procaryotes. Des séquences importantes dans la compréhension des opérations de réarrangements au sein des génomes de au cours du temps sont les éléments transposables, qui sont des fragments d’ADN ayant la possibilité de se mouvoir d’un lieu à l’autre, et peuvent se dupliquer au cours de ces transpositions. Les éléments transposables chez les procaryotes sont les séquences d’insertion, qui suivent un processus de couper-coller à l’intérieur des séquences ADN. Cependant, les outils ayant pour but de découvrir de telles séquences d’insertions d’une manière efficace et de développer une manière algorithmique originale pour découvrir les séquences d’insertions dans des génomes bactériens, et de constituer une base de données pour découvrir les séquences d’insertion dans des génomes bactériens, et de constituer une base de données les insérant. A l’aide de ces données, nous devons déduire un modèle d’évolution de ces éléments transposables, qui doit être relié à l’évolution de la séquence hôte (le génome procaryote). En particulier, nous devons déterminer si les séquences d’insertion et les génomes hôtes ont évolué de la même manière, et si ces séquences sont responsables, au moins jusqu’à une certaine mesure, de recombinaisons génomiques telles que les inversions. / The number of completely sequenced bacterial and archaeal genomes are rising steadily, such an increasingmakes it possible to develop novel kind of large scale approaches to understand genomes structureand evolution over time. Gene content prediction and genome comparison have both provided newmajor information and deciphering keys to understand evolution of prokaryotes. Important sequencesin understanding rearrangement operations inside genome sequences during evolution are the so-calledtransposable elements (TEs), which are DNA fragments or segments that have the ability to insert themselvesinto new chromosomal locations, and often make duplicate copies of themselves during transposition process.The transposable elements involved in such a move are the insertion sequences (ISs) in prokaryotes, theyfollow a cut-and-paste process inside the host DNA sequence. But the tools that deal with discovering ISs inan efficient way and that relate them to genome rearrangements are still too few and not totally accurate.The aim of this thesis is to develop an accurate algorithmic way to discover insertion sequences (ISs) inbacterial genomes and to constitute a database with these discoveries. Using these data, we must deduce amodel of evolution of these transposable elements, which must be related to the evolution of the host sequence(the prokaryotic genome). In particular, wemust ask whether insertion sequences and host genomes haveevolved in a similar way, and if ISs are responsible, at least to some extent, for genomic recombinationlike inversions.
|
12 |
Modules réactionnels : un nouveau concept pour étudier l'évolution des voies métaboliques / Reaction modules : a new concept to study the evolution of metabolic pathwaysBarba, Matthieu 16 December 2011 (has links)
J'ai mis au point une méthodologie pour annoter les superfamilles d'enzymes, en décrire l'histoire et les replacer dans l'évolution de leurs voies métaboliques. J'en ai étudié trois : (1) les amidohydrolases cycliques, dont les DHOases (dihydroorotases, biosynthèse des pyrimidines), pour lesquelles j'ai proposé une nouvelle classification. L'arbre phylogénétique inclut les dihydropyrimidinases (DHPases) et allantoïnases (ALNases) qui ont des réactions similaires dans d'autres voies (dégradation des pyrimidines et des purines respectivement). (2) L'étude de la superfamille des DHODases (qui suivent les DHOases) montre une phylogénie semblable aux DHOases, avec également des enzymes d'autres voies, dont les DHPDases (qui suivent les DHPases). De cette observation est né le concept de module réactionnel, qui correspond à la conservation de l’enchaînement de réactions semblables dans différentes voies métaboliques. Cela a été utilisé lors de (3) l'étude des carbamoyltransférases (TCases) qui incluent les ATCases (précédant les DHOases). J'ai d'abord montré l'existence d'une nouvelle TCase potentiellement impliquée dans la dégradation des purines et lui ai proposé un nouveau rôle en utilisant le concept de module réactionnel (enchaînement avec l'ALNase). Dans ces trois grandes familles j'ai aussi mis en évidence trois groupes de paralogues non identifiés qui se retrouvent pourtant dans un même contexte génétique appelé « Yge » et qui formeraient donc un module réactionnel constitutif d'une nouvelle voie hypothétique. Appliqué à diverses voies, le concept de modules réactionnels refléterait donc les voies métaboliques ancestrales dont ils seraient les éléments de base. / I designed a methodology to annotate enzyme superfamilies, explain their history and describe them in the context of metabolic pathways evolution. Three superfamilies were studied: (1) cyclic amidohydrolases, including DHOases (dihydroorotases, third step of the pyrimidines biosynthesis), for which I proposed a new classification. The phylogenetic tree also includes dihydropyrimidinases (DHPases) and allantoinases (ALNases) which catalyze similar reactions in other pathways (pyrimidine and purine degradation, respectively). (2) The DHODases superfamily (after DHOases) show a similar phylogeny as DHOases, including enzymes from other pathways, DHPDases in particular (after DHPases). This led to the concept of reaction module, i.e. a conserved series of similar reactions in different metabolic pathways. This was used to study (3) the carbamoyltransferases (TCases) which include ATCases (before DHOases). I first isolated a new kind of TCase, potentially involved in the purine degradation, and I proposed a new role for it in the light of reaction modules (linked with ALNase). In those three superfamilies I also found three groups of unidentified paralogs that were remarkably part of the same genetic context called “Yge” which would be a reaction module part of an unidentified pathway. The concept of reactions modules may then reflect the ancestral metabolic pathways for which they would be basic elements.
|
13 |
Comparaison de différentes méthodes de classification : application aux langues bantu du nord-ouest / New approaches in linguistic classification : application to Northwestern Bantu languagesGrollemund, Rebecca 17 September 2012 (has links)
Ce travail de thèse propose une étude des nouvelles méthodes de classification, dites phylogénétiques, empruntées à la biologie dans le but de proposer une nouvelle classification linguistique. Les langues étudiées appartiennent à la famille « bantu », présentes au sein de la famille linguistique Niger-Congo, parlée en Afrique. De nombreux travaux ont été établis sur les langues bantu, montrant ainsi la complexité de cette famille linguistique. Notre étude se spécialise sur la zone « Nord-Ouest », qui comprend les pays suivants : Cameroun, Guinée Équatoriale, Gabon, Congo et République Démocratique du Congo. Ce travail présente une nouvelle classification de ces langues à travers l’étude du lexique. Nous avons ainsi constitué une base de données de 100 mots appartenant au vocabulaire de base pour les 207 langues retenues. Plusieurs arbres ont été générés par l’application des algorithmes Neighbor-Joining (Saitou et Nei, 1987) et Neighbor-Net (Bryant et Moulton, 2004). L’étude de la classification des langues du Nord-Ouest a permis de mieux comprendre les relations de proximité linguistiques qui existent entre les langues parlées dans cette région. De même, l’analyse de la classification a permis de proposer un schéma de migrations des langues bantu. / This dissertation is presenting a linguistic classification based on phylogenetic methods borrowed from biology. The sample of languages considered here belongs to the Bantu family, a linguistic sub branch of Niger-Congo languages spoken in Africa. Numerous publications have shown a complexity and the diversity of Bantu languages. Our study focus on the North-West region which includes the following countries: Cameroon, Equatorial Guinea, Gabon, Congo and Democratic Republic of Congo. This new classification is based on the comparison of lexical items. We have organized a database including 100 words from the basic vocabulary for 207 languages. Several tree representations were obtained by using Neighbor-Joining (Saitou and Nei, 1987) and Neighbor-Net (Bryant and Moulton, 2004) algorithms.This study allows us to get a better understanding of the linguistic proximity of these languages. It also provides a historical scenario for Bantu migrations.
|
14 |
Combining approaches for predicting genomic evolution / Combinaison d'approches pour résoudre le problème du réarrangement de génomesAlkindy, Bassam 17 December 2015 (has links)
En bio-informatique, comprendre comment les molécules d’ADN ont évolué au cours du temps reste un problème ouvert etcomplexe. Des algorithmes ont été proposés pour résoudre ce problème, mais ils se limitent soit à l’évolution d’un caractèredonné (par exemple, un nucléotide précis), ou se focalisent a contrario sur de gros génomes nucléaires (plusieurs milliardsde paires de base), ces derniers ayant connus de multiples événements de recombinaison – le problème étant NP completquand on considère l’ensemble de toutes les opérations possibles sur ces séquences, aucune solution n’existe à l’heureactuelle. Dans cette thèse, nous nous attaquons au problème de reconstruction des séquences ADN ancestrales en nousfocalisant sur des chaînes nucléotidiques de taille intermédiaire, et ayant connu assez peu de recombinaison au coursdu temps : les génomes de chloroplastes. Nous montrons qu’à cette échelle le problème de la reconstruction d’ancêtrespeut être résolu, même quand on considère l’ensemble de tous les génomes chloroplastiques complets actuellementdisponibles. Nous nous concentrons plus précisément sur l’ordre et le contenu ancestral en gènes, ainsi que sur lesproblèmes techniques que cette reconstruction soulève dans le cas des chloroplastes. Nous montrons comment obtenirune prédiction des séquences codantes d’une qualité telle qu’elle permette ladite reconstruction, puis comment obtenir unarbre phylogénétique en accord avec le plus grand nombre possible de gènes, sur lesquels nous pouvons ensuite appuyernotre remontée dans le temps – cette dernière étant en cours de finalisation. Ces méthodes, combinant l’utilisation d’outilsdéjà disponibles (dont la qualité a été évaluée) à du calcul haute performance, de l’intelligence artificielle et de la biostatistique,ont été appliquées à une collection de plus de 450 génomes chloroplastiques. / In Bioinformatics, understanding how DNA molecules have evolved over time remains an open and complex problem.Algorithms have been proposed to solve this problem, but they are limited either to the evolution of a given character (forexample, a specific nucleotide), or conversely focus on large nuclear genomes (several billion base pairs ), the latter havingknown multiple recombination events - the problem is NP complete when you consider the set of all possible operationson these sequences, no solution exists at present. In this thesis, we tackle the problem of reconstruction of ancestral DNAsequences by focusing on the nucleotide chains of intermediate size, and have experienced relatively little recombinationover time: chloroplast genomes. We show that at this level the problem of the reconstruction of ancestors can be resolved,even when you consider the set of all complete chloroplast genomes currently available. We focus specifically on the orderand ancestral gene content, as well as the technical problems this raises reconstruction in the case of chloroplasts. Weshow how to obtain a prediction of the coding sequences of a quality such as to allow said reconstruction and how toobtain a phylogenetic tree in agreement with the largest number of genes, on which we can then support our back in time- the latter being finalized. These methods, combining the use of tools already available (the quality of which has beenassessed) in high performance computing, artificial intelligence and bio-statistics were applied to a collection of more than450 chloroplast genomes.
|
Page generated in 0.0809 seconds