Global ETD Search

21	Génomique de l'adaptation de Globodera pallida aux résistances de la pomme de terre et conséquences sur les traits d'histoire de vie du nématode / Genomics of Globodera pallida adaptation to potato resistances and consequences on the nematode life-history traits Eoche-Bosy, Delphine 23 November 2016 (has links) L’étude des modifications phénotypiques et génomiques associées à l’adaptation des pathogènes aux résistances est une étape fondamentale pour mieux comprendre et anticiper le phénomène de contournement des résistances. Le nématode à kyste Globodera pallida est un important pathogène de la pomme de terre, vis-à-vis duquel un QTL majeur de résistance, GpaVvrn, a été identifié chez Solanum vernei. Cependant, la capacité des populations de G. pallida à s’adapter à cette résistance en quelques générations seulement a été mise en évidence par évolution expérimentale. Dans ce contexte, ce travail de thèse avait pour objectifs (1) d’étudier les traits d’histoire de vie du nématode impactés par l’adaptation, afin de tester l’existence éventuelle d’un coût de virulence, et (2) d’identifier les régions génomiques impliquées dans l’adaptation, par une approche originale combinant évolution expérimentale et scans génomiques sur des lignées virulentes et avirulentes. Contre toute attente, nous avons montré que l’adaptation à la résistance issue de S. vernei entraînait une augmentation de la fitness des individus virulents sur hôte sensible. Nous avons également pu identifier des régions génomiques candidates à l’adaptation à la résistance de la plante hôte, contenant des gènes codant pour des effecteurs, et notamment des SPRYSECs, connus chez les nématodes à kyste pour être impliqués dans la suppression des défenses des plantes mais aussi dans la virulence du nématode. À terme, ces résultats s’avéreront utiles pour la conception de stratégies durables de déploiement de variétés de pommes de terre résistantes. / Studying phenotypic and genomic modifications associated with pathogen adaptation to resistance is a crucial step to better understand and anticipate resistance breakdown. The cyst nematode Globodera pallida is an important pest of potato crops, for which a major resistance QTL, GpaVvrn, has been identified in Solanum vernei. However, the capability of G. pallida populations to adapt to this resistance in only few generations has been highlighted through experimental evolution. In this context, the purposes of this work were (1) to study the nematode life-history traits impacted by adaptation, in order to test for potential existence of a virulence cost, and (2) to identify genomic regions involved in adaptation, through an original approach combining experimental evolution and genome scans on virulent and avirulent lineages. Unexpectedly, we highlighted that adaptation to resistance from S. vernei leads to an increase of virulent individual’s fitness on susceptible host. We were also able to pinpoint candidate genomic regions to adaptation to host plant resistance, containing genes encoding effectors, and especially SPRYSECs, known in cyst nematodes to be involved in suppression of host defense but also in nematode virulence. These results will ultimately be useful in order to conceive sustainable strategies of use of potato resistant cultivars DURABILITE DES RESISTANCES NEMATODE A KYSTE EVOLUTION EXPERIMENTALE POOL-SEQ SCAN GENOMIQUE CYST NEMATODE EXPERIMENTAL EVOLUTION GENOME SCAN RESISTANCE DURABILITY VIRULENCE COST
22	L'analyse de données génomiques et l'annotation à l'heure des NGS : la bioinformatique 2.0 / Genomic data analysis and annotation in the NGS era : Bioinfomatics 2.0 Paganini, Julien 15 December 2015 (has links) Les récents progrès technologiques en termes de séquençage de données génomiques ont entraîné une forte croissance des données disponibles et l'apparition de nouveaux besoins. Initialement limitée à l'analyse de petite quantité de données, la bioinformatique a dû s'adapter à ce nouveau contexte technologique et scientifique afin de répondre aux nouveaux challenges proposés. Par l'intermédiaire de différents projets réalisés dans des contextes différents, cette thèse s'intègre dans ce changement contextuel où la bioinfomatique n'est plus limitée à l'utilisation successive d'outils à objectifs unitaire entrecoupée d'étapes humaine dépendantes. Focalisés sur le développement de stratégies d'analyse complexes pour le développement ou la mise à disposition d'outils entièrement automatisés et la production de données à haute valeur ajoutée, ces travaux permettent de comprendre le rôle important de la bioinformatique 2.0. Ainsi nous montrerons comment elle doit être à même de répondre à des objectifs précis par l'intermédiaire de stratégies intégrant les concepts de la biologie, les outils bioinformatiques existants et l'expertise humaine associée au domaine. En conclusion nous discuterons du nouveau rôle et de l'impact futur de la bioinformatique 2.0 qui requiert une expertise tant sur le plan biologique qu'informatique adaptée aux données NGS. / Recent technological advances in terms of genomic sequencing data led to a strong growth of available data and the emergence of new needs. Initially limited to the analysis of simple sequence or limited amount of data, bioinformatics has to adapt to this new technological and scientific context to meet the new challenges offered. Through different projects in different genomic era, this thesis fits into this contexts change where bioinfomatics is no longer limited to the use of tool with unitary goal and human dependent steps. Focused on the development of complex analysis strategies for the development or the availability of fully automated tools and high-value data, this work introduce the important role of bioinformatics version 2.0. We will show how it is able to answer to precise biological question through specific strategy that integrate all the biological concepts, existing bioinformatics tools and human expertise related to the domain. To conclude, we discuss about the role and the impact of the bioinformatics 2.0 that requires a expert vision at biological and computers level adapted to NGS data. Bioinformatique Genomique Evolution Phylogenie Ngs Stratégie Assemblage Annotation Automatisation. Bioinformatics Genomic Evolution Phylogeny Ngs Strategy Assembly Annotation Automation 572
23	Extreme radiation tolerance of Deinococcus deserti : Characterization of the central regulator IrrE Ludanyi, Monika 27 November 2014 (has links) Les bactéries du genre Deinococcus sont extrêmement tolérantes à de fortes doses de radiations. Des études antérieures ont montré que IrrE est nécessaire à la radiotolérance et à l'induction des gènes de réparation de l'ADN après exposition des cellules à l'irradiation. Pendant des années il est resté inconnu comment IrrE active l'expression de ces gènes. L'objectif de ma thèse était la caractérisation de la voie de signalisation dépendent de IrrE chez Deinococcus deserti. Pour cela, des approches biochimiques et génétiques ont été utilisées. Les premiers résultats ont fortement suggéré que IrrE agit indirectement sur l'activation de l'expression des gènes. En utilisant des expériences in vitro et in vivo, nous avons montré que IrrE de Deinococcus deserti interagit avec DdrO, un régulateur potentiel qui est codé par un gène radio-induit et qui est, comme IrrE, conservé chez les Deinococcus. De plus, IrrE clive DdrO in vitro mais aussi in vivo lorsque les deux protéines sont co-exprimées chez Escherichia coli. Ce clivage est abolit en présence d'un agent chélateur de métaux, l'EDTA. Chez D. deserti, le clivage de DdrO dépendent de IrrE a été observé mais seulement après exposition à l'irradiation. En parallèle, nous avons montré que la répression du promoteur d'un gène radio-inductible est dépendante de DdrO. Nos résultats montrent donc que IrrE est une métalloprotéase et nous proposons que le répresseur DdrO soit désactivé après clivage par IrrE conduisant à l'induction de différents gènes indispensables pour la réparation de l'ADN et la survie des cellules après exposition de Deinococcus à l'irradiation. / Deinococcus bacteria are famous for their extreme tolerance to high doses of radiation. Earlier studies have shown that IrrE protein is required for radiation tolerance and for induction of DNA repair genes after exposure of cells to radiation. However, for years it has remained unknown how IrrE activates gene expression. The aim of my thesis was to characterize the IrrE-dependent regulation pathway in Deinococcus deserti. For this, biochemical and genetic approaches were used. The first results strongly suggested that IrrE activates gene expression in an indirect manner. Then, using other in vivo and in vitro experiments, IrrE from Deinococcus deserti was found to interact with DdrO, a predicted regulator encoded by a radiation-induced gene that is, like irrE, highly conserved in Deinococcus. Moreover, IrrE was found to cleave DdrO in vitro and also in vivo when the proteins were co-expressed in Escherichia coli. This cleavage was not observed in the presence of the metal chelator EDTA. In D. deserti, IrrE-dependent cleavage of DdrO was observed only after exposure to radiation. Furthermore, DdrO-dependent repression of the promoter of a radiation-induced gene was shown. Our results demonstrate that IrrE is a metalloprotease and we propose that IrrE-mediated cleavage inactivates repressor protein DdrO, leading to transcriptional induction of various genes required for DNA repair and cell survival after exposure of Deinococcus to radiation. Deinococcus Tolerance aux irradiation et desiccation Stress oxidative Reparation de l'ADN Genomique comparative Proteome Deinococcus Desiccation and radiation tolerance Oxydative stress DNA repair Comparative genomics Proteome 579
24	Utilisation de l'espèce sauvage diploide Gossypium australe F. Muell. pour l'amélioration de l'espèce cultivée tétraploïde G. hirsutum L. par la méthode des lignées monosomiques d'addition Sarr, Djibril 12 September 2008 (has links) Summary : The wild diploïd species Gossypium australe carry interesting agronomic characters such as resistance to wilt fusarium and "delay of the gossypol glands morphogenesis in the seed " that makes it an important source of variability for the genetic improvement of the main cultivated cotton species G. hirsutum. One of the approach to introgress these characters is to isolate and exploit monosomic alien addition lines (MAAL). In order to isolate new MAAL of G. australe in G. hirsutum, the [2(G.hirsutum x G.australe)x G.hirsutum] pentaploid was backcrossed as male parent to G. hirsutum. Among the 253 BC1 derivatives obtained, 106 plants (42%) presented morphological alterations attributed to presence of G. australe chromatin. To define an SSR linkage group for each of the 13 G. australe chromosomes, 42 plants representative of the phenotypic variability observed in the BC1 generation and seven alien addition lines already isolated in our laboratory were analyzed using SSR markers developed from the G. hirsutum species. Out of the 150 SSR markers used, 100 % amplified G. australe DNA and 84 (56 %) generated 89 polymorphic loci. All these loci but two have been assigned, by means of an cluster algorithm, to 13 linkage groups assumed to match up to the 13 chromosomes of the diploid species. On this basis, about 60% of the analyzed plants were multisomic addition lines, 20%, MAAL while 20 % carrying no markers were supposed to be euploid. The newly isolated MAAL appeared to be the same as those already available. Five disomic alien addition plants carrying at least one additional chromosome different from the chromosomes of G. australe previously isolated in a monosomic addition configuration were selfed and the BC1S1 progenies obtained have been analyzed with SSR markers and GISH. Five new MAAL of G. australe in G. hirsutum have thus been isolated. In order to monitor the potentialities of using MAAL for the transfer of genetic material from the additional chromosome to the genetic background, the transmission frequency and integrity of the supernumerary chromosome have been analyzed with SSR markers in the self-progeny of five MAAL. Three of them revealed a transmission frequency significantly lower than the 3:1 expected ratio, one MAAL presented an exclusive preferential transmission of the additional chromosome. In these four MAAL the alien chromosome was transmitted almost unaltered. With the fifth MAAL the alien chromosome was normally transmitted but was altered in half of the plants containing G. australe chromatin. One of the investigated MAAL characterized by its brown fiber produced few plants carrying also white fibers. It has been shown that this mosaicism was due to the loss of the alien supernumerary chromosome. The complete loss of this chromosome seems to be linked to its fragmentation. Résumé : L'espèce diploïde sauvage Gossypium australe possède des caractères agronomiques d'intérêt tels que la résistance au fusarium et le "retard à la morphogenèse des glandes à gossypol" qui en font une importante source de variabilité pour l'amélioration génétique de la principale espèce de cotonnier cultivé G. hirsutum. Une des approches pour l'introgression de ces caractères est la production et l'exploitation de lignées monosomiques d'addition (LMA). Pour isoler les LMA de G. australe sur G. hirsutum, le pentaploïde [2(G.hirsutum x G.australe)x G.hirsutum] a été rétrocroisé comme parent mâle avec l'espèce tétraploïde. Sur les 253 graines obtenues, 106 (42%) ont donné des plantes présentant une morphologie nettement distincte de celle de G. hirsutum. Cette différence a été attribuée à la présence de chromosomes de G. australe. Afin de définir des groupes de liaison pour chacun des chromosomes de G. australe, 42 plantes représentatives de la variabilité phénotypique observée ainsi que 7 lignées d'addition déjà isolées ont été sélectionnées et analysées avec des marqueurs SSR développés sur l'espèce tétraploïde. Tous les 150 marqueurs utilisés ont amplifié l'ADN de G. australe et 84 (56%) ont généré 89 loci polymorphes. Tous ces loci, sauf deux, ont pu être assignés, par classification numérique, à 13 groupes de liaison supposés correspondre aux 13 chromosomes de l'espèce diploïde. Sur cette base, 60% des plantes analysées sont des plurisomiques d'addition; 20%, des LMA tandis que 20 % ne portant aucun marqueur ont été supposées euploïdes. Les nouvelles LMA isolées s'étant révélées être identiques à celles déjà isolées, 5 plantes disomiques d'addition portant au moins un chromosome non-encore isolé à l'état monosomique d'addition ont été autofécondées et leur descendance analysée avec des marqueurs SSR et par la GISH. Cinq nouvelles LMA ont pu ainsi être isolées. Afin d'étudier les potentialités d'utilisation de la méthode des LMA pour le transfert de matériel génétique de l'espèce sauvage vers l'espèce cultivée, la fréquence de transmission et l'intégrité du chromosome surnuméraire, a été analysée avec des marqueurs SSR dans une génération autofécondée de cinq LMA. Trois lignées ont donné un taux de transmission inférieur au ratio attendu de 3:1, chez la quatrième lignée le chromosome surnuméraire a été transmis à toute la descendance. Pour ces quatre lignées le chromosome additionnel a été transmis presque inaltéré. Avec la cinquième lignée, le chromosome additionnel a été transmis suivant le taux attendu mais a été altéré dans la moitié des plantes contenant de la chromatine de G. australe. Une des lignées analysées caractérisée par la couleur brune de ses fibres a produit quelques plantes portant également des fibres blanches. Il a été montré que ce mosaïcisme de la couleur des fibres était dû à la perte du chromosome additionnel. Cette perte semble être liée à une fragmentation du chromosome. Cotton/coton Gossypium/Gossypium SSR marker/marqueur microsatellite
25	Développement de facteurs de régulation photoactivables Neveu, Pierre 02 July 2007 (has links) (PDF) Les cellules d'un organisme multicellulaire a justent constamment la concentration de leur consti- <br />tuants en fonction de leurs interactions avec leurs voisines et l'environnement. Une reponse adaptee est particulierement importante pendant l'embryogenese. Au cours de cette these, nous avons developpe une technique permettant de controler des fonctions cellulaires a l'echelle de la cellule unique dans un organisme intact. L'utilisation de molecules cagees et de l'excitation biphotonique a permis de remplir le but vise. <br />Dans un premier temps, nous exposons les precautions a prendre et les proprietes necessaires des groupements protecteurs pour l'utilisation d'une telle technique dans un contexte biologique. Dans un deuxieme temps, nous nous interessons a la caracterisation des proprietes d'absorption a deux photons des groupements protecteurs utilises au cours de ce travail. Enfin, nous presentons une application de la technique a la voie de signalisation acide retinoique dans le poisson zebre. Nous montrons que nous pouvons delivrer une concentration bien definie de molecules dans une seule cellule avec une resolution temporelle de la seconde dans un embryon intact. Grace a ceci, nous avons pu etudier la dynamique de cette voie de signalisation et mettre en evidence un controle negatif rapide qui est cellule autonome et identifier la MAP kinase p38 comme etant necessaire a ce phenomene. <br />Nous presentons aussi en annexes la demonstration de principe de l'utilisation de composes cages pour generer des recombinaisons genomiques chez le poisson zebre et inhiber une fonction enzymatique (en l'occurence une activite topoisomerase). composes cages acide retinoique poisson zebre map kinase controle de la transcription excitation biphotonique recombinaison genomique acide nalidixique
26	Genetic Susceptibility and Molecular Characterization of Glioma / Susceptibilité génétique et caractérisation moléculaire des gliomes Labreche, Karim 27 June 2018 (has links) Les gliomes constituent les plus fréquentes des tumeurs malignes primaires du système nerveux central. Les liens qui existent entre ces tumeurs et un certain nombre de cancers rares héréditaires, comme les Neurofibromatoses I et II ou les syndromes de Turcot et de Li-Fraumeni, attestent d’une prédisposition génétique aux gliomes. L’observation d’un risque deux fois plus élevé de développer un gliome chez les parents de premier degré de patients atteints suggère aussi une possible prédisposition génétique dans les gliomes sporadiques. Par ailleurs, l’analyse à haut débit permet de préciser le profil somatique des gliomes et d’identifier des biomarqueurs pronostiques voire prédictifs et s’inscrire dans une démarche de traitement personnalisé du patient. Durant ma thèse, je me suis focalisé sur deux axes de recherches complémentaires; l’identification de gènes de susceptibilité et la découverte de nouveaux gènes fréquemment mutés dans les gliomes, afin de déterminer les voies de signalisation contribuant à la gliomagenèse. Dans leur ensemble, les résultats obtenus dans cette thèse apportent non seulement des informations importantes sur la nature de la prédisposition génétique aux gliomes mais également de son association spécifique pour les différents sous-types de tumeurs. La découverte d’un nouveau gène muté, offre la perspective à plus long terme d’un traitement personnalisé pour chaque patient sur la base du profil génétique de sa tumeur. / Gliomas are the most common adult malignant primary tumour of the central nervous system. Thus far, no environmental exposures has been linked to risk except for ionizing radiation, which only accounts for a very small number of cases. Direct evidence for inherited predisposition to glioma is provided by a number of rare inherited cancer syndromes, such as Turcot's and Li–Fraumeni syndromes, and neurofibromatosis. Even collectively, these diseases however account for little of the twofold increased risk of glioma seen in first-degree relatives of glioma patients. My research was centred on two complementary research activities: Identifying susceptibility genes for glioma to delineate key biological pathways contributing to disease pathogenesis and to identify new recurrent mutated genes for glioma to provide for further insights into glial oncogenesis and suggesting targets for novel therapeutic strategies. Collectively the findings in this thesis provide increased insight into the nature of genetic predisposition to glioma and substantiate the often distinct associations between susceptibility variants and glioma molecular groups. In addition the discovery of a new mutated gene in glioma offers the potential to support drug development and advance precision medicine for this tumours. Genomique du Cancer Susceptibilité génétique au cancer Gliomes Étude d'association génomique Séquençage à haut débit Cancer genomics Genetic Susceptibility to Cancer Glioma Genome Wide Association Studies High Throughtput Sequencing
27	Le clone épidémique "Bourg-en-Bresse" de l’espèce Burkholderia cenocepacia : origine, positionnement phylétique et phénomènes génétiques liés à son émergence / The "Bourg-en-Bresse" epidemic clone of Burkholderia cenocepacia : origin, phylogenetic position and genetic events associated with its emergence Graindorge, Arnault 25 November 2009 (has links) Le complexe Burkholderia cepacia (Bcc) englobe 17 espèces retrouvées dans les infections pulmonaires d'individus atteints de mucoviscidose. Les bactéries de ce complexe sont présentes dans les sols, la rhizosphère de grandes cultures, les eaux usées et peuvent également être rencontrées dans le cadre d'infections nosocomiales. En France, les espèces B. multivorans et B. cenocepacia (Bcen) sont les espèces majoritaires au niveau des infections de patients atteints de mucoviscidose. Divers clones épidémiques ont été décrits au sein de l’espèce Bcen dont le clone ET12 associé au "syndrome cepacia". En 2004, une épidémie nosocomiale impliquant un clone du Bcc est survenue dans un hôpital de l’Ain. Durant ce travail, l’origine de ce clone (B&B), sa classification au sein du Bcc et certains phénomènes génétiques liés à son émergence ont été étudiés. Cela a permis d’identifier ce clone comme appartenant à l’espèce Bcen et une forte proximité de celui-ci avec la lignée ET12. L’étude des facteurs transcriptionnels de la famille σ70 au sein du Bcc a mis en évidence une structure génétique similaire entre la lignée ET12 et ce clone, mais différente de celle observée chez les autres espèces du Bcc. L’analyse d’éléments génétiques répétés de la famille des séquences d’insertion (IS) a cependant permis d’observer une organisation génomique distincte de la lignée ET12. Celle-ci a été reliée à des phénomènes d’instabilité génétique notamment à des phénomènes d’acquisition d’éléments génétiques mobiles de type îlot génomique. L’ensemble de ce travail a permis de caractériser un ensemble de phénomènes génétiques pouvant expliquer l’émergence de clones épidémiques tels que le clone B&B. / The Burkholderia cepacia complex (Bcc) comprises 17 species found in lung infections of individuals with cystic fibrosis. The bacteria of this complex are present in the soil, the rhizosphere of field crops, wastewater and may also be encountered in nosocomial infections. In France, the B. multivorans and B. cenocepacia species are the major species in infections of cystic fibrosis patients. Various epidemic clones have been described within the B. cenocepacia species whose ET12 clone associated with "cepacia syndrome". In 2004, a nosocomial outbreak involving a clone of Bcc occurred in a French hospital. During this outbreak, origin of this clone (B&B clone), its classification within the Bcc and several genetic events associated with its emergence have been studied. These investigations have identified this clone as belonging to the species B. cenocepacia with a strong proximity with the ET12 lineage. The study of transcriptional factors of σ70 family within the Bcc has revealed a similar genetic structure between the ET12 lineage and this clone, but different from that observed in other species of Bcc. Analysis of genetic elements repeated family of insertion sequences (IS), however, allowed to observe a distinct genomic organization of the ET12 lineage. It has been linked to phenomen of genetic instability including acquisition of mobile genetic elements like genomic island (GI). All of this work has helped to characterize a set of genetic events may explain the emergence of epidemic clones such as clone B&B. Bactérie pathogène opportuniste Burkholderia cenocepacia Virulence Facteur sigma Séquences d’insertion Ilots génomiques Génomique comparative Clone épidémique Opportunistic pathogen Burkholderia cenocepacia Virulence Sigma factor Insertion sequence Genomic island Comparative genomique Epidemic clone
28	Algorithmes de comparaison de génomes appliqués aux génomes bactériens / Algorithms for the comparisons of genomic sequences applied to bacterial genomes Uricaru, Raluca 14 December 2010 (has links) Avec plus de 1000 génomes complets disponibles (la grande majorité venant de bactéries), les analyses comparatives de génomes deviennent indispensables pour leurs annotations fonctionnelles, ainsi que pour la compréhension de leur structure et leur évolution, et s'appliquent par exemple en phylogénomique ou au design des vaccins. L'une des approches de plus utilisées pour comparer des génomes est l'alignement de leurs séquences d'ADN, i.e. alignement de génomes complets, c'est à dire identifier les régions de similarité en s'affranchissant de toute annotation. Malgré des améliorations significatives durant les dernières années, des outils performants pour cette approche ainsi que des méthodes pour l'estimation de la qualité des résultats qu'elle produit, en particulier sur les génomes bactériens, restent encore à développer. Outre leurs grandes tailles qui rendent les solutions classiques basées sur la programmation dynamique inutilisables, l'alignement de génomes complets posent des difficultés supplémentaires dues à leur évolution particulière, comprenant: la divergence, qui estompe les similarités entre les séquences, le réordonnancent des portions génomiques (réarrangements), ou l'acquisition de matériel génétique extérieur, qui produit des régions non alignables entres les séquences, e.g. transfert horizontal des gènes, phages. En conséquence, les solutions pour l'alignement de génomes sont des heuristiques, dont la plus commune est appelée stratégie basée sur des ancres. Cette stratégie commence par identifier un ensemble initial de régions de similarité (phase 1). Ensuite une phase de chaînage sélectionne un sous-ensemble (non-chevauchantes et généralement colinéaires) de ces similarités de poids maximal, nommées ancres (phase 2). Les phases 1 et 2 sont appliquées de manière récursive sur les régions encore non-alignées (phase 3). La dernière phase consiste en l'application systématique des outils d'alignement classiques sur toutes les régions courtes qui n'ont pas encore été alignées. Cette thèse adresse plusieurs problèmes liés à l'alignement de génomes complets dont: l'évaluation de la qualité des résultats produits par les outils d'alignement et l'amélioration de la stratégie basée sur des ancres. Premièrement, nous avons créé un protocole pour évaluer la qualité des résultats d'alignement, contenant des mesures de calcul quantitatives et qualitatives, dont certaines basées sur des connaissances biologiques. Une analyse de la qualité des alignements produits par deux des principaux outils existants sur des paires de génomes bactériens intra-espèces révèle leurs limitations: des similarités non détectées et des portions d'alignement incorrectes. À partir de ces résultats, qui suggèrent un manque de sensibilité et spécificité, nous proposons un nouvel outil pour l'alignement deux à deux de génomes complets, YOC, qui implémente une version simplifiée de la stratégie basée sur des ancres, contenant seulement deux phases. Dans la phase 1, YOC améliore la sensibilité en utilisant comme ancres, pour la première fois dans cette stratégie, des similarités locales basées sur des graines espacées, capables de détecter des similarités plus longues dans des régions plus divergentes. Cette phase est suivie par une méthode de chainage adaptée aux similarités locales, un nouveau type de chaînage colinéaire, permettant des chevauchements proportionnels. Nous avons donné une formulation de ce nouveau problème et réalisé un premier algorithme. L'algorithme, qui adopte une approche de programmation dynamique basée sur le paradigme de la ``sweep-line'', donne une solution optimale, i.e. est exacte, et s'exécute en temps quadratique. Nous avons montré que cet algorithme, comparé au chainage colinéaire classique, améliore les résultats sur des génomes bactériens, tout en restant aussi efficace en pratique. / With more than 1000 complete genomes available (among which, the vast majority come from bacteria), comparative genomic analysis become essential for the functional annotation of genomes, the understanding of their structure and evolution and have applications in phylogenomics or vaccine design. One of the main approaches for comparing genomes is by aligning their DNA sequences, i.e. whole genome alignment (WGA), which means identifying the similarity regions without any prior annotation knowledge. Despite the significant improvements during the last years, reliable tools for WGA and methodology for estimating its quality, in particular for bacterial genomes, still need to be designed. Besides their extremely large lengths that make classical dynamic programming alignment methods unsuitable, aligning whole genomes involves several additional difficulties, due to the mechanisms through which genomes evolve: the divergence, which let sequence sim ilarity vanish over time, the reordering of genomic segments (rearrangements), or the acquisition of external genetic material generating regions that are unalignable between sequences, e.g. horizontal gene transfer, phages. Therefore, whole genome alignment tools implement heuristics, among which the most common is the anchor based strategy. It starts by detecting an initial set of similarity regions (phase 1), and, through a chaining phase (phase 2), selects a non-overlapping maximum-weighted, usually collinear, subset of those similarities, called anchors. Phases 1 and 2 are recursively applied on yet unaligned regions (phase 3). The last phase (phase 4) consists in systematically applying classical alignment tools to all short regions still left unaligned.This thesis addresses several problems related to whole genome alignment: the evaluation of the quality of results given by WGA tools and the improvement of the classical anchor based strategy. We first designed a protocol for evaluating the quality of alignment results, based on both computational and biological measures. An evaluation of the results given by two state of the art WGA tools on pairs of intra-species bacterial genomes revealed their shortcomings: the failure of detecting some of the similarities between sequences and the misalignment of some regions. Based on these results, which imply a lack in both sensitivity and specificity, we propose a novel, pairwise whole genome alignment tool, YOC, implementing a simplified two-phase version of the anchor strategy. In phase 1, YOC improves sensitivity by using as anchors, for the first time, local similarities based on spaced seeds that are capable of detecting larger similarity regions in divergent sequences. This ph ase is followed by a chaining method adapted to local similarities, a novel type of collinear chaining, allowing for proportional overlaps. We give a formulation for this novel problem and provide the first algorithm for it. The algorithm, implementing a dynamic programming approach based on the sweep-line paradigm, is exact and runs in quadratic time. We show that, compared to classical collinear chaining, chaining with overlaps improves on real bacterial data, while remaining almost as efficient in practice. Our novel tool, YOC, is evaluated together with other four WGA tools on a dataset composed of 694 pairs of intra-species bacterial genomes. The results show that YOC improves on divergent cases by detecting more distant similarities and by avoiding misaligned regions. In conclusion, YOC should be easier to apply automatically and systematically to incoming genomes, for it does not require a post-filtering step to detect misalignment and is less complex to calibrate. Genomique comparative Alignement de génomes complets Stratégie basée sur des ancres Graines espacées Chainage des fragments Graphe trapézoïdal Comparative genomics Whole genome alignment Anchor based strategy Spaced seeds Fragment chaining Trapezoid graphs

Search results