Global ETD Search

1	Pan-génome du riz africain cultivé Oryza glaberrima et son ancêtre sauvage Oryza barthii / Pan-genome of cultivated african rice Oryza glaberrima and his wild ancestor Oryza barthii Monat, Cécile 10 November 2016 (has links) La diversité d’une espèce est représentée par la somme de la diversité de chacun des individus qui la compose. Elle peut être observée à différentes échelles : individuelle, organique, tissulaire, cellulaire, génomique, génique, ou bien à l’échelle de la base nucléotidique. L’étude de la diversité d’une espèce est importante pour mieux la comprendre et nous permettre de retracer son histoire évolutive, de la comparer avec d’autres espèces notamment entre espèces sauvages et cultivées. Nous nous intéressons aux processus de domestication, et particulièrement à leurs impacts sur la structure du pan-génome. Le pan-génome est divisé en trois compartiments : (i) le core-génome qui contient tous les gènes présents chez tous les individus de l’espèce ; (ii) le génome dispensable qui contient l’ensemble des gènes qui sont absents chez au moins un individu ; (iii) et enfin le génome individu-spécifique qui contient les gènes présents uniquement chez un individu.L’objectif de ce travail de thèse était de mettre au point une nouvelle méthode d’analyse pan-génomique applicable sur un grand nombre d’individus. Pour cela, nous avons travaillé sur un jeu de données de reséquençage massif du riz Africain cultivé O. glaberrima et de son ancêtre sauvage O. barthii. Dans un premier temps nous avons vérifié l’existence d’une structure pan-génomique sur notre modèle. Pour cela nous avons travaillé à petite échelle avec trois accessions de l’espèce cultivée. Elles ont d’abord été séquencées, assemblées, annotées puis nous avons cherché à détecter des séquences spécifiques à chacune de ces accessions.Dans un second temps nous avons mis au point notre méthode en travaillant avec près de 200 génomes des deux espèces.Ces génomes ont été séquencés grâce aux technologies NGS puis directement mappés sur un génome de référence externe, celui du riz Asiatique. Nous avons alors appliqué notre méthode d’analyse pan-génomique basée sur la déviation de la profondeur deséquençage pour chaque gène. Nous avons ensuite comparé les enrichissement d’ontologies par compartiments et par espèce dans le but d’identifier des différences liées aux processus de domestication. Enfin, nous avons étudié plus précisément les appartenances pan-génomiques des membres de famille de gènes.Parce que le pan-génome de l’espèce cultivé est plus petit que le core-génome de l’espèce sauvage nous avons confirmé la perte de diversité en terme de présence/ absence de gènes chez le riz Africain au cours du processus de domestication. Curieusement nous avons aussi mis en avant l’augmentation du nombre de gènes dispensable chez l’espèce cultivée par rapport à son relatif sauvage.Ainsi, malgré une forte réduction du pan-génome de l’espèce cultivé lors de la « première » sélection, les 1000 générations de processus de domestication ont suffit à réintroduire une forme de diversité à travers l’augmentation du nombre de gènes dispensables.Afin d’automatiser une grande partie des manipulations d’analyses de données NGS nous avons aussi développé un outil de génération de pipelines d’analyses. De part sa généricité et sa robustesse il pourra être utilisé dans différents domaines, pour plu-sieurs types de données. Grâce aux nombreux logiciels qui y sont intégrés et de par le suivi que l’équipe de développement entend poursuivre, il pourra être utilisé dans la caractérisation de plus en plus de choses. Par exemple les variations structurales, les associations génotypes-phénotypes, l’épigénétique et pourquoi pas la métagénomique.Ce travail a permis la mise au point d’une nouvelle méthode d’analyse des données pan-génomiques rapide de par sa vision globale plutôt que via des comparaisons deux-à-deux. Cette méthode s’adresse aux génomes grands et complexes comme ceux des plantes, mais aussi aux jeux de données massifs. / Species diversity is represented by the sum of the diversity of each of the individuals composing it. It can be seen at differents cales: individual, organic, tissular, cellular, genomic, gene, and even nucleotic. The study of the diversity of species is important to better understand and allow tracking its evolutionary history, comparing it to other species, in particular wild to cultivated. We focused on the domestication, and particularly its impact on the pan-genome structure.The pan-genome is divided into three compartments: (i) the core-genome containing all the genes present in all individuals of the species; (ii) the dispensable genome containing all genes absent in at least one individual; (iii) and finally the individual-specific genome containing genes present only in one individual.The objective of this thesis was to develop a new method for pan-genomic analysis that can apply to a large number of indi-viduals. For this, we worked on a massive resequencing data set of cultivated African rice O. glaberrima and of its wild ancestor O. barthii. At first we checked the existence of a pan-genomic structure on our model. For this we worked on a small scale, with three accessions of cultivated species. They were sequenced, assembled, annotated then analyzed to detect specific sequences for each accession.Secondly we developed our approach working with nearly 200 genomes of both species. These genomes were sequenced using Illumina technology and mapped to the external reference genome, of the Asian rice. We applied our pan-genomic method analysis based on the deviation of the depth of sequencing for each gene. We then compared the ontology enrichment compartments and species in order to identify differences related to the domestication process. Finally, we looked specifically to pan-genomic genes belonging to gene family. Because the pan-genome of the cultivated species is smaller than the core-genome of the wild one, we confirmed the loss ofdiversity in terms of presence/ absence of genes in African rice during the domestication process. Curiously we have also high lighted the increase in the number of dispensable genes in the crop from its wild relative. Thus, despite a sharp reduction of the pan-genomeof the species cultivated in the “first” selection, the 1,000 generations of domestication process were enough to reintroduce a formof diversity through increasing the number of dispensable genes.To automate much of the data analysis of NGS manipulations we have also developed a tool to generate analysis pipelines.Due to its generic and robustness it can be used in different areas, for several types of data. With many softwares integrated and by monitoring that the development team will continue, it may be used in the characterization of more and more things. For example,structural variations, genotype-phenotype associations, epigenetics and metagenomics. This work enabled the development of a new analytical method for rapid genome-wide data through its global vision ratherthan through two by two comparisons. This method is for large and complex genomes such as those of plants, but also to massivedata sets. Pan-Génome Génomique Génomique comparative Bioinformatique Riz africain Pan-Genome Genomic Comparative genomic Bioinformatic African rice
2	Analyse du génome et du pan-génome pour classifier les bactéries émergentes / Genome and pan-genome analysis to classify emerging bacteria Caputo, Aurélia 23 November 2017 (has links) La bio-informatique est essentielle aujourd'hui dans de nombreux domaines comme par exemple la gestion et l'analyse des données, la génomique avec l'assemblage et l'annotation de génomes, la phylogénie, la métagénomique, la recherche de nouvelles espèces bactériennes et la classification taxonomique. Mon premier travail a porté sur l'assemblage et l'analyse d'un génome bactérien à partir de données de métagénomique. Le génome de Akkermansia muciniphila a pu être assemblé par mapping directement à partir de données issues d'échantillons de selle humaine. En 2012, la culturomics a permis de décrire le plus grand génome d'une bactérie isolée chez l'homme ; Microvirga massiliensis (9.3 Mb). Mon deuxième travail a permis d'assembler ce génome. Par la suite, nous avons essayé de comprendre pourquoi cette bactérie a un génome si grand. En effet, on observe qu'elle possède un plasmide, un nombre important d'ORFans et d'ARNr 16S ainsi que des gènes de grande taille. Elle comporte également un nombre important de transposons. Enfin, la troisième et dernière partie de mon travail se base sur les analyses de pan-génome pour la taxonomie bactérienne. La taxonomie est sujette à de nombreux changements selon les données disponibles et les méthodes utilisées, et suit l'évolution des techniques d'identification des bactéries. Nous avons alors redéfinit la notion d'espèce à l'aide du pan-génome pour le genre Klebsiella. En effet, une différence trop importante entraînant une cassure au niveau du ratio core/pan-génome, révèle l'apparition d'une nouvelle espèce. Cette découverte nous amène à utiliser le pan-génome comme outils novateur pour la taxonomie bactérienne. / Since the introduction of DNA sequencing by Sanger and Coulson in 1977, considerable progress has been made. A growing number of data is being generated in several areas and requires more and more advances in computing. Bio-informatics is essential today in many fields such as data management and analysis, genomics with assembly and genome annotation, comparative genomics, phylogeny, metagenomics, research new bacterial species and taxonomic classification. My first work based on assembling and analyzing bacterial genome from metagenomic data. The genome of Akkermansia muciniphila could be assembled by mapping directly from data from human stool sample. In 2012,culturomics allowed to describe the largest genome of a bacterium isolated in human; Microvirga massiliensis (9.3 Mb). My second work allowed to assemble this genome. Subsequently, we tried to understand why this bacterium has such a large genome. Indeed, it is observed that it possesses a plasmid, a large number of ORFans and 16S rRNAs as well as large genes which one is more than 14kb. It also includes a large number of transposasons. Finally, the third and last part of the work concerns pan-genome analyzes for bacterial taxonomy. Taxonomy is a set of many changes based on available data, methods used and evolution of bacterial identification techniques. We have examined the notion of species using the genome at the genus Klebsiella. Indeed, a too large difference leading to a break in the core/pan-genome ratio undoubtedly reveals the appearance of a new species. This discovery leads us to use the pan-genome as an innovative tool for bacterial taxonomy. Bio-Informatique Génomique Culturomics Taxonomie Pan-Génome Définition d'espèces Bioinformatics Genomics Culturomics Taxonomy Pan-Genome Species definition
3	Reconstitution de pan-génomes microbiens par séquençage métagénomique aléatoire : Application à l’étude du microbiote intestinal humain / Abundance-based reconstitution of microbial pan-genomes from whole-metagenome shotgun sequencing data : Application to the study the human gut microbiota Plaza onate, Florian 10 December 2018 (has links) L’avènement du séquençage métagénomique aléatoire a révolutionné la microbiologie en permettant la caractérisation sans culture préalable de communautés microbiennes complexes telles que le microbiote intestinal humain. Des outils bioinformatiques récemment développés atteignent une résolution au niveau de la souche en recensant des gènes accessoires ou en capturant des variants nucléotidiques (SNPs). Toutefois, ces outils sont limités par l’étendue des génomes de référence disponibles qui sont loin de couvrir toute la variabilité microbienne. En effet, de nombreuses espèces n’ont pas encore été séquencées ou sont représentées par seulement quelques génomes.La création de catalogues de gènes non redondants par assemblage de novo suivie du regroupement des gènes co-abondants révèlent une partie de la matière noire microbienne en reconstituant le répertoire de gènes d’espèces potentiellement inconnues. Bien que les méthodes existantes identifient avec précision les gènes core présents dans toutes les souches d’une espèce, elles omettent de nombreux gènes accessoires ou les divisent en petits groupes de gènes qui ne sont pas associés aux core génomes. Or, capturer ces gènes accessoires est indispensable en recherche clinique et épidémiologique car ces derniers assurent des fonctions spécifiques à certaines souches telles que la pathogénicité ou la résistance aux antibiotiques.Lors de cette thèse, nous avons développé MSPminer, un logiciel performant qui reconstitue et structure des pan-génomes d’espèces métagénomiques (ou MSPs pour Metagenomic Species Pan-genomes) en regroupant les gènes co-abondants dans un ensemble d’échantillons métagénomiques. MSPminer s’appuie sur une nouvelle mesure robuste de la proportionnalité couplée à un classificateur empirique pour regrouper et distinguer les gènes core mais aussi les gènes accessoires des espèces microbiennes.Grâce à MSPminer, nous avons structuré un catalogue de 9,9 millions de gènes du microbiote intestinal humain en 1 661 MSPs. L’homogénéité de l’annotation taxonomique, de la composition nucléotidique ainsi que la présence de gènes essentiels indiquent que les MSPs ne correspondent pas à des chimères mais à des objets biologiquement cohérents regroupant des gènes provenant de la même espèce. Parmi ces MSPs, 1 301 (78%) n’ont pas pu être annotées au niveau espèce montrant que de nombreux microorganismes colonisant l’intestin humain demeurent inconnus malgré les progrès substantiels des techniques de culture microbienne. Remarquablement, les MSPs capturent bien plus de gènes que les clusters générés par les outils existants tout en garantissant une spécificité élevée.Cet ensemble de MSPs peut d’ores et déjà être utilisé pour le profilage taxonomique et la découverte de biomarqueurs dans des échantillons de selles humaines. Ainsi, nous tirons parti des MSPs pour comparer l’impact sur le microbiote intestinal des deux principaux types de chirurgie bariatrique, la gastrectomie par laparoscopie (LSG) et la dérivation gastrique de Roux-en-Y (LRYGB). Enfin, les MSPs ouvrent la voie à des analyses au niveau souche. Dans une autre cohorte, nous avons mis en évidence l’existence de sous-espèces associées à l’origine géographique de l’hôte en étudiant les profils de présence/absence des gènes accessoires groupés dans les MSPs. / The advent of shotgun metagenomic sequencing has revolutionized microbiology by allowing culture-independent characterization of complex microbial communities such as the human gut microbiota. Recently developed bioinformatics tools achieved strain-level resolution by making a census of accessory genes or by capturing nucleotide variants (SNPs). Yet, these tools are hampered by the extent of available reference genomes which are far from covering all the microbial variability. Indeed, many species are still not sequenced or are represented by only few genomes.Building of non-redundant gene catalogs followed by the binning of co-abundant genes reveals a part of the microbial dark matter by reconstituting the gene repertoire of species potentially unknown. While existing methods accurately identify core genes present in all the strains of a species, they miss many accessory genes or split them into small gene groups that remain unassociated to core genomes. However, capturing these accessory genes is essential in clinical research and epidemiology because they provide functions specific to certain strains such as pathogenicity or antibiotic resistance.In this thesis, we developed MSPminer, a computationally efficient software tool that reconstitutes Metagenomic Species Pan-genomes (MSPs) by binning co-abundant genes across metagenomic samples. MSPminer relies on a new robust measure of proportionality coupled with an empirical classifier to group and distinguish not only species core genes but accessory genes also.With MSPminer, we structured a catalog made up of 9.9 million genes of the human gut microbiota in 1 661 MSPs. The homogeneity of the taxonomic annotation, of the nucleotide composition as well as the presence of essential genes indicate that the MSPs do not correspond to chimeras but to biologically consistent objects grouping genes from the same species. Among these MSPs, 1 301 (78%) could not be annotated at species level showing that many microorganisms colonizing the human intestinal tract are still unknown despite the substantial improvements of microbial culture techniques. Remarkably, MSPs capture more genes than clusters generated by existing tools while ensuring high specificity.This set of MSPs can be readily used for taxonomic profiling and biomarkers discovery in human gut metagenomic samples. In this way, we take advantage of the MSPs to compare the impact of two main types of surgeries, the laparoscopic sleeve gastrectomy (LSG) and the Roux-En-Y gastric bypass (LRYGB). Finally, the MSPs open the way to strain-level analyses. In another cohort, we identified subspecies associated the host geographical origin by studying presence/absence patterns of the accessory genes grouped in the MSPs. Séquençage métagénomique aléatoire Microbiote intestinal humain Matière noire microbienne Pan-Génome Binning métagénomique Shotgun metagenomic sequencing Human gut microbiota Microbial dark matter Pan-Genome Metagenomic binning 576.6
4	Investigation of Wolbachia symbiosis in isopods and filarial nematodes by genomic and interactome studies / Étude des relations symbiotiques entre Wolbachia et les isopodes et nématodes par analyses génomiques et de l'intéractome Geniez, Sandrine 27 September 2013 (has links) Les Wolbachia sont des alpha-proteobactéries présentes chez de nombreux arthropodes et nématodes filaires. Ces bactéries héritées maternellement induisent chez leurs hôtes des phénotypes allant du parasitisme au mutualisme, avec le long de ce continuum des phénotypes tels que la féminisation (F), l'incompatibilité cytoplasmique (IC) ou la mort des mâles. Wolbachia est ainsi un modèle particulièrement intéressant pour étudier les différents types de relations symbiotiques.Chez Brugia malayi, comme pour les autres nématodes filaires, Wolbachia vit en symbiose obligatoire avec son hôte. L'élimination de la bactérie par des traitements antibiotiques entraîne une perte de fertilité voire la mort du nématode. Chez l'isopode terrestre Armadillidium vulgare, Wolbachia induit la féminisation des mâles génétiques en femelles fonctionnelles entraînant des biais de sex-ratio vers les femelles dans la descendance.Pour comprendre les mécanismes impliqués dans ces deux symbioses, nous avons mis au point une nouvelle méthode de capture pour isoler l'ADN de Wolbachia et séquencer 8 souches de Wolbachia d'isopodes (F et IC). Une étude de génomique comparative a permis d'établir un premier pan-génome des bactéries du genre Wolbachia et d'identifier 2, 5 et 3 gènes présents seulement chez les souches mutualistes, féminisantes ou induisant la mort des mâles. L'expression des gènes potentiellement impliqués dans la féminisation ou le mutualisme a été étudiée au cours du développement de l'hôte. L'étude de l'interactome protéique bactérie-hôte a ensuite été initiée en utilisant comme appât des protéines bactériennes à domaines eucaryotes en vue d'identifier les cibles de Wolbachia chez l'hôte. / Bacteria of the genus Wolbachia are gram-negative alpha-proteobacteria present in many arthropods and filarial nematodes. These obligate intracellular bacteria are maternally inherited and induce a large number of phenotypes across the symbiosis continuum from mutualism to parasitism, including feminization (F), cytoplasmic incompatibility (CI) or male killing. Studying Wolbachia symbioses is therefore of particular interest in the investigation of symbiotic relationships.In Brugia malayi and other filarial nematodes, they are obligate leading to a loss of worm fertility, and eventual death upon their depletion with antibiotic. In arthropods, they rather are parasitic. In the isopod crustacean Armadillidium vulgare they cause feminization when present: genetic males develop as functional female leading to female biased sex-ratio progenies.In order to understand the molecular mechanisms of these two symbioses, we set up a new capture procedure to catch Wolbachia DNA and performed whole-genome sequencing on 8 Wolbachia strains, symbionts of isopods (F & CI). Comparative genomics led to the establishment of the Wolbachia pan-genome as well as the identification of phenotype related gene patterns. We identified 2, 5 and 3 genes that are only found in mutualist, feminizing and male killing strains, respectively. Expression of genes potentially involved in feminization and mutualism were also analyzed throughout host post-embryonic development. Host-symbiont interactome approach was then initiated by protein-protein interaction studies using bacterial proteins with eukaryote like motifs as bait in order to identify Wolbachia host targets involved in symbiosis. Wolbachia Symbiose Séquençage de génomes bactériens Ngs Pan--Génome Génomique comparative Effecteurs bactériens Interactome hôte/symbiote Transcriptomique Armadillidium vulgare Crustacés isopodes Féminisation Brugia malayi Nématodes Mutualisme Wolbachia Symbiosis Whole--Genome sequencings Ngs Pan--Genome Comparative genomics Bacterial effectors Host--Symbiont interactome Transcriptomics Armadillidium vulgare Isopod crustaceans Feminization Brugia malayi Nematodes Mutualism 579

1

Page generated in 0.0248 seconds