Spelling suggestions: "subject:"arbor phylogénétique""
1 |
Évaluation des classifications phylogénétiques des Bacillaceae basées sur les gènes de l'opéron rrn et de gènes de ménageCheikh Rouhou, Mouna January 2006 (has links) (PDF)
Plusieurs approches ont, jusqu'à présent, été utilisées pour l'identification de nouvelles souches ainsi que pour la caractérisation et la classification des différentes espèces au sein des Bacillaceae. Cependant, la plupart de ces méthodologies présentent certaines insuffisances. L'objectif de cette étude est d'établir et d'évaluer des classifications phylogénétiques des Bacillaceae basées sur divers gènes, d'analyser l'effet de l'hétérogénéité alléliques sur celles-ci,
ainsi que d'étudier la distribution des mutations. Seuls les Bacillaceae dont le génome est complètement séquencé ont été considérés. Dans ce travail, tous les allèles des trois gènes de l'opéron ribosomal ont été utilisés. Trois gènes codant pour des protéines ont également été choisis pour la construction de phylogénies et la comparaison avec celles basées sur l'opéron ribosomal. L'analyse phylogénétique de dix souches de Bacillaceae a été réalisée suivant la méthode de Neighbour-Joining (NJ) en utilisant les paramètres de Kimura. La fiabilité et la robustesse de la classification ont été évaluées à l'aide de la méthode "Bootstrap". L'analyse basée sur tous les allèles des trois gènes de l'opéron ribosomal (16S, 23S et 5S) montre que les arbres obtenus présentent la même topologie et répartissent les Bacillaceae en trois groupes et deux sous-groupes. Aucun des gènes n'a permis la discrimination des espèces ou des souches au sein du groupe cereus au sens large. L'analyse phylogénétique des Bacillaceae pourrait donc se limiter à l'un des gènes de l'opéron ribosomal puisque aucune information additionnelle n'est apportée par l'utilisation d'un gène en particulier. Les régions inter géniques lTS1 (16S-23S) et ITS2 (23S-5S) n'ont pas permis, non plus, de discriminer au sein du groupe cereus au sens large. Mais elles ont, néanmoins, mis en évidence l'hétérogénéité alléliques. L'approche basée sur les séquences nucléotidiques des gènes de ménage: adénylate kinase (adk) , shikimate 5-déshydrogénase (aroE) et la sous-unité B de l'ADN gyrase (gyrB), ainsi que de leurs séquences concaténées, a permis une meilleure discrimination notamment au sein du groupe cereus au sens large. Les Bacillaceae sont répartis en trois groupes et sept sous-groupes dont cinq au sein du groupe cereus au sens large. L'utilisation des séquences en acides aminées des protéines codées par les gènes adk, aroE et gyrB et de leurs séquences concaténées a généré, quant à elle, des classifications incongruentes. De plus, elle n'a pas permis une meilleure discrimination des Bacillaceae au sein du groupe cereus au sens large. Plusieurs espèces se retrouvent dans un même faisceau secondaire. Un tel regroupement trouve son explication dans la dégénérescence du code génétique. L'utilisation des séquences nucléotidiques des gènes de ménage serait donc une meilleure approche pour la classification phylogénétique des Bacillaceae. L'analyse de tous les allèles des différents gènes de l'opéron ribosomal (16S, 23S et 5S) montre qu'ils sont hétérogènes et que cette hétérogénéité n'a pas d'effet notable sur la classification phylogénétique. Il est donc justifié de se limiter à un seul allèle de l'un des trois gènes de l'opéron ribosomal lors de l'étude phylogénétique des Bacillaceae. L'étude de la distribution des mutations au sein des trois gènes de l'opéron ribosomal (16S, 23S et 5S) pour les Bacillaceae montre qu'elle n'est pas uniforme et qu'il existe au sein de ces gènes des régions hypervariables dans lesquels se concentrent les mutations. La comparaison de la distribution des mutations au sein du gène 16S pour les Bacillaceae et les y-protéobactéries montre que ces régions hypervariables sont spécifiques pour chaque groupe de bactéries. L'étude phylogénétique basée sur la concaténation des régions hypervariables du gène 16S pour les Bacillaceae a révélé que la topologie de l'arbre découlerait de la structure de ces régions. L'étude phylogénétique des Bacillaceae basée le gène 16S pourrait se limiter à l'analyse des régions hypervariables de ce gène. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Adénylate kinase (adk), ARN 16S, ARN 23S, ARN 5S, Bacillaceae, Classification phylogénétique, Distribution des mutations, Gènes de ménage, Hétérogénéité alléliques, Régions hypervariables, y-protéobactéries, shikimate5-déshydrogénase (aroE) et sous-unité B de l'ADN gyrase (gyrB).
|
2 |
Étude phylogénétique des y-protéobactéries basée sur les gènes 16S ARNr et des gènes codant pour des protéinesLee, Hoon-Yong January 2006 (has links) (PDF)
Les bactéries se prêtent très bien aux analyses phylogénétiques en raison du fait que plusieurs génomes ont été entièrement séquencés -et leur nombre continue d'augmenter -et leurs génomes sont petits et ne contiennent que peu d'ADN répétitif en contraste avec les génomes des eucaryotes. La molécule d'ARNr 16S, l'ARN composant de la petite sous-unité du ribosome, a été établie comme la macromolécule de choix pour les analyses phylogénétiques et l'identification des espèces bactériennes. En dépit de sa position centrale, l'utilisation de l'ARNr 16S n'est pas sans inconvénients. En effet, l'évolution d'un seul gène n'est pas nécessairement représentative de l'évolution d'un génome entier, des hétérogénéités entre des copies du gène d'ARNr 16S -des allèles -ne sont pas exceptionnelles, et des copies paralogues peuvent suggérer des phylogénies différentes. De plus, au cours des dernières années, des analyses phylogénétiques basées sur des séquences codant pour des protéines conservées -telles des gènes de ménage (house-keeping genes) -ont donné des résultats discordants.
Parmi les bactéries, les y-protéobactéries avec 33 génomes entièrement séquencés sont les plus étudiées, certainement en raison de leurs importances cliniques et biologiques.
L'objectif de mon travail a été, d'une part d'étudier l'hétérogénéité des séquences des allèles de l'ARNr 16S chez 33 y-protéobactéries et de déterminer si un seul allèle par bactérie est suffisant pour établir une phylogénie, d'autre part de construire les arbres phylogénétiques de ces 33 y-protéobactéries à partir de l'analyse comparée des séquences de certains gènes de ménage à savoir: l'adénylate kinase (adk), la shikimate déshydrogénase (aroE), la glucose-6-phosphate déshydrogénase (gdh) et de leurs séquences concaténées. Ces phylogénies seront comparées entre elles et aussi à celle établie à partir du gène de l'ARNr 16S. Les analyses phylogénétiques ont démontré que la plupart des séquences alléliques d'une même souche sont identiques ou quasi identiques et sont regroupées à l'intérieur d'un même genre et d'une même espèce. À cause de leurs homogénéités, un seul allèle du gène de l'ARNr 16S est suffisant pour construire la phylogénie des y-protéobactéries au niveau du genre et de l'espèce. Les arbres phylogénétiques construits à partir de chacun des trois gènes de ménage -adk, aroE et gdh -et des séquences concaténées des trois gènes sont, en général, similaires à l'arbre construit à partir du gène de l'ARNr 16S, aux niveaux de la famille, du genre, de l'espèce et de la souche, avec certaines exceptions. Les gènes de ménage, cependant, montrent un plus haut taux de substitutions nucléotidiques que le gène de l'ARNr 16S. De plus, parce que les trois gènes de ménage ont chacun un pourcentage plus bas de similarité de séquences que le gène de l'ARNr 16S, ils ont montré une meilleure différenciation des neuf souches de bactéries entériques Escherichia-Shigella-Salmonella. Ils peuvent potentiellement révéler des relations sur des branches plus profondes d'un arbre phylogénétique que ne le peut le gène de l'ARNr 16S. De plus, puisque ces gènes de ménage sont utilisés dans les typages de séquence multi-locus "multilocus sequence typing (MLST)", nous pouvons nous attendre à ce que le nombre de séquences disponibles dans le domaine public pour ces trois gènes de ménage augmente rapidement les rendant ainsi d'autant plus utiles pour complémenter le gène de l'ARNr 16S dans des études phylogénétiques, ou pour certaines autres analyses phylogénétiques très ciblées. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : y-protéobactéries, Gènes de ménage, Phylogénie, ARNr 16S.
|
3 |
Un nouvel algorithme pour l'inférence de réseaux d'hybridationWillems, Matthieu 05 1900 (has links) (PDF)
Depuis une quarantaine d'années, de nombreux algorithmes et logiciels ont été développés pour inférer des arbres phylogénétiques. Cependant, certains phénomènes biologiques comme l'hybridation ou le transfert latéral de gènes ne peuvent pas être représentés sous la forme d'un arbre. On utilise ainsi de plus en plus des réseaux phylogénétiques. Les recherches sur ce sujet ont débuté il y a une dizaine d'années et les outils disponibles actuellement pour déterminer des réseaux phylogénétiques sont beaucoup moins performants que dans le cas des arbres. L'objectif principal de mes recherches consiste ainsi à développer une nouvelle méthode pour inférer des réseaux phylogénétiques en se limitant au cas de l'hybridation. J'ai ainsi développé un nouvel algorithme qui permet de retrouver tous les arbres phylogénétiques et de détecter tous les hybrides entre des branches voisines. Quand les parents des hybrides ne sont pas voisins, il trouve les bons hybrides avec des taux de détection proches de 100%, mais il trouve trop d'hybrides et n'identifie pas toujours les bons parents de ces hybrides. Ce nouvel algorithme est itératif et est basé sur le critère des moindres carrés qui permet de déterminer la configuration optimale à chaque itération. Il a été implémenté dans le langage C++ et plusieurs centaines de simulations ont été effectuées pour tester ses fonctionnalités.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : arbre phylogénétique, inférence phylogénétique, réseau réticulé, hybridation, critère des moindres carrés.
|
4 |
Détection des transferts horizontaux de gènes : modèles et algorithmes appliqués à l'évolution des espèces et des languesBoc, Alix 01 1900 (has links) (PDF)
Le transfert horizontal de gènes (THG, ou transfert latéral de gènes) est un mécanisme d'évolution naturel qui consiste en le transfert direct du matériel génétique d'une espèce à une autre. La possibilité que le transfert horizontal de gènes puisse jouer un rôle clé dans l'évolution biologique est un changement fondamental dans notre perception des aspects généraux de la biologie évolutive survenu ces dernières années. Par exemple, les bactéries et les virus possèdent des mécanismes sophistiqués d'acquisition de nouveaux gènes par transfert horizontal leur permettant de s'adapter et d'évoluer adéquatement dans leur environnement. Jusqu'à tout récemment, les méthodes de détection de ce mécanisme reposaient essentiellement sur l'analyse de séquences et étaient très rarement automatisées. Il est impossible de représenter l'évolution d'organismes ayant subi des THG à l'aide d'arbres phylogénétiques acycliques. La présentation adéquate est celle d'un réseau. Dans cette thèse, nous décrivons un nouveau modèle de ce mécanisme d'évolution, en se basant sur l'étude de différences topologiques et métriques entre un arbre d'espèces et un arbre du gène inférés pour le même ensemble d'espèces. Les méthodes qui en découlent ont été appliquées à des jeux de données réelles où des hypothèses de transferts latéraux de gènes étaient plausibles. Des simulations Monté-Carlo ont été menées afin d'évaluer la qualité des résultats par rapport à des méthodes existantes. Nous présentons également une généralisation du modèle de transferts horizontaux complets qui est applicable pour détecter des transferts partiels et identifier des gènes mosaïques. Dans ce dernier modèle, on suppose qu'une partie seulement du gène a été transférée. Enfin, nous présentons une application de ces nouvelles méthodes servant à modéliser des emprunts de mots survenus durant l'évolution des langues indo-européennes.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : arbre phylogénétique, réseau réticulé, transfert horizontal de gènes, critère des moindres carrés, distance de Robinson et Foulds, dissimilarité de bipartitions, biolinguistique.
|
5 |
Un nouvel algorithme pour retrouver les relations phylogénétiques entre la distribution géographique des espèces et leurs compositions génétiquesTahiri, Nadia 12 1900 (has links) (PDF)
L'objectif de ce projet de maîtrise est de développer un nouvel algorithme permettant de retrouver les relations phylogénétiques entre un arbre de référence (par exemple, l'arbre de la distribution géographique des espèces ou des paramètres climatiques) et un arbre caractérisant un fragment de l'alignement de séquences multiples (ASM). Pour ce faire, nous récupérerons d'abord les différents fragments d'un ASM donné. Nous les soumettrons par la suite aux différents programmes du paquet PHYLIP (Seqboot, ProtDist ou DnaDist, Neighbor et Consense) et le programme PhyML afin d'obtenir un arbre consensus avec les valeurs de bootstrap sur ses branches. À partir de chaque arbre consensus, nous calculerons son bootstrap moyen. De plus, nous comparerons topologiquement l'arbre consensus obtenu à l'arbre de référence pour connaître la distance de Robinson et Foulds (RF) normalisée entre eux. Pour chaque fragment d'un ASM, nous conserverons uniquement les données relatives à des fragments correspondant à la distance RF normalisée la plus petite (i.e., celle qui représente la plus grande similitude entre les deux arbres). Dans le cas où plusieurs fragments correspondront à la même valeur de la distance RF normalisée, l'estimation se poursuivra sur l'arbre consensus ayant le score de bootstrap le plus élevé (i.e., meilleur support de l'arbre). Pour connaître la performance de notre algorithme, nous utiliserons un jeu de données de 52 espèces appartenant au groupe des Carnivores se localisant en Amérique du Nord. Nous récupérons aussi 21 protéines issues de la base de données GenBank. La construction des arbres de référence se fera à partir de données climatiques de l'habitat de ces espèces (i.e., température, précipitation et altitude). Notre algorithme permettra de trouver des sous-séquences des gènes donnant une similarité topologique accrue entre l'arbre de référence et l'arbre phylogénétique obtenu à partir des séquences.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : arbre phylogénétique, phylogéographie, distance de Robinson et Foulds, bootstrap, alignement de séquences multiples, paquet PHYLIP, GenBank.
|
6 |
Des algorithmes bioinformatiques pour la recherche des régions génomiques responsables d'une maladieBadescu, Dunarel January 2009 (has links) (PDF)
L'évolution des espèces est régie par les modifications stochastiques qui ont eu lieu au niveau du code génétique -l'ADN -composé d'une suite de petites molécules (les nucléotides). Selon l'ampleur de ces évènements, il y a d'abord des modifications à petite échelle, impliquant quelques nucléotides -les insertions, délétions et substitutions. Due à l'impossibilité actuelle de différencier les insertions des délétions, on les appelle communément indels. D'un autre coté, il ya des modifications à grande échelle -impliquant parfois des grandes régions génomiques ou des chromosomes. Les modifications à grande échelle les plus fréquentes sont: les duplications, translocations, inversions et délétions. Au cours de ce projet, nous avons développé une méthode de génomique comparée, capable de relier l'information épidémiologique, comme la carcinogenicité et l'invasivité des souches, aux séquences génomiques. Cette méthode permet de détecter des régions statistiquement significatives à analyser plus en détail par des biologistes, tout en étant capable de discriminer ce seuil à l'aide du calcul des p-values. Nous avons utilisé cette méthode dans l'étude du virus du papillome humain et de la bactérie Neisseria Meningitidis, bactérie responsable de la méningite. Pour le virus du papillome humain, notre méthode a été capable de détecter le domaine PDZ, une région du gène E6, qui est une condition sine qua non de la carcinogenicité du produit de ce gène. Au cours des analyses phylogénétiques de cette famille nous avons trouvé une corrélation statistiquement significative entre les événements à petite échelle et les données épidémiologiques. Par la suite nous avons proposé une séquence de tests pour orienter l'analyse statistique de cette corrélation. Nous avons également remarqué que la carcinogenicité est généralement monophylétique, donc issue d'un ancêtre commun. L'arbre phylogénétique inféré est le premier basé sur les génomes entiers, ce qui a permis d'étudier la variabilité des topologies de gènes par rapport à celle du génome. Pour la bactérie Neisseria Meningitidis nous avons montré qu'il est possible de syntoniser les fonctions de discrimination, pour établir la différence entre les régions responsables du maximum d'invasivité et celles qui ont un rôle structural dans ce processus, détection des structures moléculaires connues (i.e. les anses extra cellulaires, dans notre cas). Les résultats de nos travaux ont permis la mise à la disposition de la communauté internationale de deux bases de données, pour le VPH et le Neisseria, respectivement. Ces bases contiennent des régions candidates à être analysées en laboratoire par des biologistes. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Algorithme pour la détection des régions carcinogènes, Événements évolutionnaires, Analyse de redondance, Arbre phylogénétique, Conception de vaccin, Mutations, Invasivité, Neisseria Meningitidis, Virus du papillome humain.
|
7 |
Algorithmes pour la détection de transferts horizontaux de gènes complets et partielsDiallo, Alpha Boubacar 12 1900 (has links) (PDF)
Avec l'arrivée des données moléculaires vers la fin des années 70, nous avons assisté à la découverte de nouveaux mécanismes d'évolution primordiaux dont l'échange du matériel génétique entre les espèces. Un tel échange peut se faire horizontalement, quand l'organisme intègre le matériel génétique provenant d'un autre organisme qui n'est pas son descendant direct, ou verticalement, quand l'organisme reçoit du matériel génétique à partir de son ancêtre le plus proche. Le problème de la détection et de la classification des transferts horizontaux de gènes (THG) est parmi les plus ardus en bioinformatique. Dans cette thèse, nous décrivons cinq nouveaux algorithmes pour la détection de THGs complets ou partiels qui seront basés sur des comparaisons topologiques et métriques entre un arbre d'espèces et un arbre de gène inférés pour le même ensemble d'espèces. Ces algorithmes incluent l'algorithme de détection de THGs complets ainsi que ses versions interactive et consensus. Les deux algorithmes de détection de transferts partiels que nous avons proposés peuvent être vus comme une généralisation de l'algorithme de détection de transferts complets. Ils peuvent être utilisés pour identifier des gènes mosaïques. Nous présentons aussi dans cette thèse une version parallèle de l'algorithme de détection de THGs complets, ainsi qu'une plateforme pour la transformation semi-automatique de programmes bioinformatiques séquentiels en programmes parallèles. Une interface Web intégrant tous les programmes développés dans le cadre de ce projet doctoral a aussi été mise au point.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : algorithmes bioinformatiques, arbre phylogénétique, programmation parallèle, réseau réticulé, transfert horizontal de gènes (THG).
|
8 |
Développement et parallélisation d'algorithmes bioinformatiques pour la reconstruction d'arbres phylogénétiques et de réseaux réticulésDiallo, Alpha Boubacar 09 1900 (has links) (PDF)
Dans ce mémoire nous abordons de prime abord la reconstruction d'arbres et de réseaux phylogénétiques, à travers deux méthodes d'inférence. Les arbres et les réseaux sont deux supports pour la représentation de l'évolution d'un groupe d'espèces étudiées. Les modèles d'évolution d'espèces qui seront traités sont les suivants : 1) Le modèle arborescent classique qui a longtemps été le seul support formel pour la représentation des relations génétiques entre les espèces. 2) Le modèle en réseau qui permet de représenter des mécanismes phylogénétiques importants pouvant jouer un rôle clé dans l'évolution et pouvant s'expliquer par le phénomène de l'évolution réticulée. Nous nous sommes particulièrement intéressés aux algorithmes d'inférence de réseaux de transferts horizontaux de gènes. Un transfert horizontal de gènes permet à deux espèces de s'échanger, partiellement ou totalement, différents gènes au cours de l'évolution. Le travail effectué sur la reconstruction d'arbres et de réseaux phylogénétiques a mené à la publication de trois articles. Ensuite, nous abordons le problème de réduction du temps d'exécution de différents programmes bioinformatiques. Ce problème a pris de l'ampleur à cause de la croissance du volume de données biologiques et du blocage de la puissance des ordinateurs autour de 3,4GHZ depuis environ deux ans. Nous décrivons un procédé d'accélération des calculs effectués par différents algorithmes d'inférence et de représentation de l'évolution des espèces, en utilisant le parallélisme. Le parallélisme mis en place a été réalisé à travers une librairie standard de passage de messages (Message Passing Interface). Nous montrons les différentes formes de parallélisme, les architectures de systèmes parallèles, quelques environnements qui permettent de supporter l'exécution des applications de façon à exprimer le parallélisme, ainsi que les approches utilisées pour paralléliser différents modèles d'évolution. Les versions parallèles des algorithmes d'évolution ont été développées et installées sur une « grappe » (i.e. cluster) Linux ayant 16 lames possédant chacune deux processeurs et sa propre mémoire.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : algorithmes d'évolution, arbre phylogénétique, réseau phylogénétique, transferts horizontaux de gènes, programmation parallèle, Message Passing Interface (MPI).
|
9 |
Ancestral Reconstruction and Investigations of Genomics Recombination on Chloroplasts Genomes / Reconstruction ancestrale et investigation de recombinaison génomique sur chloroplastes génomesAl-Nuaimi, Bashar 13 October 2017 (has links)
La théorie de l’évolution repose sur la biologie moderne. Toutes les nouvelles espèces émergent d’une espèce existante. Il en résulte que différentes espèces partagent une ascendance commune, telle que représentée dans la classification phylogénétique. L’ascendance commune peut expliquer les similitudes entre tous les organismes vivants, tels que la chimie générale, la structure cellulaire, l’ADN comme matériau génétique et le code génétique. Les individus d’une espèce partagent les mêmes gènes mais (d’ordinaire) différentes séquences d’allèles de ces gènes. Un individu hérite des allèles de leur ascendance ou de leurs parents. Le but des études phylogénétiques est d’analyser les changements qui se produisent dans différents organismes pendant l’évolution en identifiant les relations entre les séquences génomiques et en déterminant les séquences ancestrales et leurs descendants. Une étude de phylogénie peut également estimer le temps de divergence entre les groupes d’organismes qui partagent un ancêtre commun. Les arbres phylogénétiques sont utiles dans les domaines de la biologie, comme la bio informatique, pour une phylogénétique systématique et comparative. L’arbre évolutif ou l’arbre phylogénétique est une exposition ramifiée les relations évolutives entre divers organismes biologiques ou autre existence en fonction des différences et des similitudes dans leurs caractéristiques génétiques. Les arbres phylogénétiques sont construits à partir de données moléculaires comme les séquences d’ADN et les séquences de protéines. Dans un arbre phylogénétique, les nœuds représentent des séquences génomiques et s’appellent des unités taxonomiques. Chaque branche relie deux nœuds adjacents. Chaque séquence similaire sera un voisin sur les branches extérieures, et une branche interne commune les reliera à un ancêtre commun. Les branches internes sont appelées unités taxonomiques hypothétiques. Ainsi, les unités taxonomiques réunies dans l’arbre impliquent d’être descendues d’un ancêtre commun. Notre recherche réalisée dans cette dissertation met l’accent sur l’amélioration des prototypes évolutifs appropriés et des algorithmes robustes pour résoudre les problèmes d’inférence phylogénétiques et ancestrales sur l’ordre des gènes et les données ADN dans l’évolution du génome complet, ainsi que leurs applications.[...] / The theory of evolution is based on modern biology. All new species emerge of an existing species. As a result, different species share common ancestry,as represented in the phylogenetic classification. Common ancestry may explainthe similarities between all living organisms, such as general chemistry, cell structure,DNA as genetic material and genetic code. Individuals of one species share the same genes but (usually) different allele sequences of these genes. An individual inheritsalleles of their ancestry or their parents. The goal of phylogenetic studies is to analyzethe changes that occur in different organisms during evolution by identifying therelationships between genomic sequences and determining the ancestral sequences and theirdescendants. A phylogeny study can also estimate the time of divergence betweengroups of organisms that share a common ancestor. Phylogenetic trees are usefulin the fields of biology, such as bioinformatics, for systematic phylogeneticsand comparative. The evolutionary tree or the phylogenetic tree is a branched exposure the relationsevolutionary between various biological organisms or other existence depending on the differences andsimilarities in their genetic characteristics. Phylogenetic trees are built infrom molecular data such as DNA sequences and protein sequences. Ina phylogenetic tree, the nodes represent genomic sequences and are calledtaxonomic units. Each branch connects two adjacent nodes. Each similar sequencewill be a neighbor on the outer branches, and a common internal branch will link them to acommon ancestor. Internal branches are called hypothetical taxonomic units. Thus,Taxonomic units gathered in the tree involve being descended from a common ancestor. Ourresearch conducted in this dissertation focuses on improving evolutionary prototypesappropriate and robust algorithms to solve phylogenetic inference problems andancestral information about the order of genes and DNA data in the evolution of the complete genome, as well astheir applications.
|
10 |
Modules réactionnels : un nouveau concept pour étudier l'évolution des voies métaboliquesBarba, Matthieu 16 December 2011 (has links) (PDF)
J'ai mis au point une méthodologie pour annoter les superfamilles d'enzymes, en décrire l'histoire et les replacer dans l'évolution de leurs voies métaboliques. J'en ai étudié trois : (1) les amidohydrolases cycliques, dont les DHOases (dihydroorotases, biosynthèse des pyrimidines), pour lesquelles j'ai proposé une nouvelle classification. L'arbre phylogénétique inclut les dihydropyrimidinases (DHPases) et allantoïnases (ALNases) qui ont des réactions similaires dans d'autres voies (dégradation des pyrimidines et des purines respectivement). (2) L'étude de la superfamille des DHODases (qui suivent les DHOases) montre une phylogénie semblable aux DHOases, avec également des enzymes d'autres voies, dont les DHPDases (qui suivent les DHPases). De cette observation est né le concept de module réactionnel, qui correspond à la conservation de l'enchaînement de réactions semblables dans différentes voies métaboliques. Cela a été utilisé lors de (3) l'étude des carbamoyltransférases (TCases) qui incluent les ATCases (précédant les DHOases). J'ai d'abord montré l'existence d'une nouvelle TCase potentiellement impliquée dans la dégradation des purines et lui ai proposé un nouveau rôle en utilisant le concept de module réactionnel (enchaînement avec l'ALNase). Dans ces trois grandes familles j'ai aussi mis en évidence trois groupes de paralogues non identifiés qui se retrouvent pourtant dans un même contexte génétique appelé " Yge " et qui formeraient donc un module réactionnel constitutif d'une nouvelle voie hypothétique. Appliqué à diverses voies, le concept de modules réactionnels refléterait donc les voies métaboliques ancestrales dont ils seraient les éléments de base.
|
Page generated in 0.0735 seconds