Spelling suggestions: "subject:"métagénomique."" "subject:"métagénomiques.""
11 |
Développement et applications d'outils d'analyse métagénomique des communautés microbiennes associées aux insectes / Development and application of bioinformatic tools for the metagenomic analysis of insect associated microbial communitiesGuyomar, Cervin 07 December 2018 (has links)
Ces travaux de thèse reposent sur le double objectif de proposer des approches innovantes pour l’étude des relations entre un hôte et son microbiote, et de les appliquer à la description fine de l’holobionte du puceron du pois par des données métagénomiques. Les relations symbiotiques façonnent le fonctionnement et l’évolution de tous les organismes, mais restent décrites de manière imparfaite, notamment à cause de la difficulté à caractériser la diversité génomique des partenaires microbiens constitutifs des holobiontes. L’essor des technologies de séquençage métagénomique révolutionne l’étude de ces systèmes, mais pose également des problèmes méthodologiques pour analyser les jeux de données métagénomiques. La métagénomique est ici appliquée au puceron du pois, un modèle d’étude des relations symbiotiques qui abrite une communauté bactérienne d’une complexité modérée, idéale pour développer de nouvelles approches de caractérisation de la diversité microbienne. Cette thèse vise à mieux décrire la communauté de symbiotes qu’abrite cet holobionte, notamment en distinguant les différents niveaux de variabilité génomique en son sein. Nous présentons une démarche pour l’analyse métagénomique d’holobiontes, qui repose d’abord sur l’assignation taxonomiques des lectures par alignement à des génomes de référence ou préalablement assemblés, puis sur la recherche de variants génomiques. L’étude de génotypes complets de symbiotes permet de retracer l’histoire évolutive des relations hôte-microbiote avec une résolution élevée. Chez le puceron du pois, nous mettons en évidence des niveaux et structures de diversité génomique différents selon les symbiotes, que nous proposons d’expliquer par les modalités de transmission ou l’histoire évolutive propre à chacun des partenaires microbiens. Cette approche repose sur la disponibilité d’un génome de référence adapté, qui est souvent difficile à obtenir en métagénomique. Dans un second temps, nous présentons donc une méthode d’assemblage guidé par référence en contexte métagénomique. Cette méthode se déroule en deux temps : le recrutement et l’assemblage de lectures par alignement sur un génome de référence distant, puis l’assemblage de novo ciblé des régions manquantes, permis par des développements complémentaires apportés au logiciel MindTheGap. Comparativement à un assembleur métagénomique, cette méthode permet l’assemblage d’un seul génome en un temps réduit, et permet de détecter d’éventuels variants structuraux sur le génome ciblé. Appliqué au puceron du pois, MindTheGap a réalisé l’assemblage du symbiote obligatoire Buchnera en un seul contig, et a permis d’identifier différents variants structuraux du bactériophage APSE. Ces travaux ouvrent la voie à la fois à une caractérisation plus précise des relations hôte-microbiote chez le puceron du pois par des approches fonctionnelles et métaboliques, ainsi qu’à l’application des outils présentés à des systèmes plus complexes. / The aim of this PhD thesis is to develop innovative approaches to characterize host-microbiota relationships, and to apply them to finely explore the pea aphid microbiota using metagenomic data. Symbiotic relationships play a major role in the life and evolution of all organisms, but are imperfectly described, essentially because of the difficult characterization of the genomic diversity of the microbial partners. The rise of high throughput metagenomic sequencing is a game changer for the study of those systems, but also raises methodological issues to analyze large metagenomic datasets. Metagenomic is here applied to the pea aphid holobiont, a model system for the study of symbiotic relationships, sheltering a moderately complex microbial community. This level of complexity seems to be ideal to develop new approaches for the strain-resolved characterization of host-microbiota relationships. This thesis aims at a better description of this symbiotic community by distinguishing several scales of metagenomic diversity. In a first part, we present a framework for the metagenomic analysis of holobionts, relying first on the taxonomic assignation of reads by alignment to reference or newly assembled genomes, and then on the detection of genomic variants. Whole genome variant profiles make possible to track the evolutionary history of host-microbiota associations with a high resolution. In the case of the pea aphid, we highlight different scales and structures for the metagenomic diversity of the different symbionts, accounting for different transmission modes or evolutionary histories specific to each microbial partner. This framework is based on the availability of a suitable reference genome, that may be hard to obtain in a metagenomic context. In a second part, we therefore present a novel method for reference guided genome assembly from metagenomic data. This method is based on two steps. First, the recruitment and assembly of reads by mapping metagenomic reads on a distant reference genome, and second, the de novo assembly of the missing regions, allowed by the development of an improved version of the software MindTheGap. Compared to a standard metagenomic assembler, this methods makes possible to assemble a single genome in a reasonable time, and allows to detect eventual structural variations within the targeted genome. When applied to the pea aphid holobiont, MindTheGap yielded single contig assemblie of the obligatory symbiont Buchnera aphidicola, and helped to identify different structural variants of the bacteriophage APSE. This works paves the way to a finer characterization of host-microbiota interactions, and to the application of the presented approaches to more complex systems.
|
12 |
Les viromes associés aux plantes sauvages : vers des stratégies de caractérisation optimisées et variabilité dans divers environnements / Wild plant species associated viromes : towards improved characterization strategies and variability in various ecological environmentsMa, Yuxin 12 September 2019 (has links)
Les approches de métagénomique basées sur l’utilisation des techniques de séquençage haut débit ont ouvert une nouvelle ère pour la découverte non biaisée et la caractérisation génomique des virus. Comme pour les autres virus, de telles études montrent que la diversité des virus phytopathogènes a jusqu’à tout récemment été fortement sous-estimée. Ces virus constituant une composante potentiellement importante des écosystèmes naturels ou des agrosystèmes anthropisés, il est important d’explorer la diversité des virus associés aux populations végétales et de comprendre les forces structurant cette diversité dans le temps et dans l’espace. Dans le même temps, le développement de telles études reste confronté à des questions d’ordre méthodologique concernant, par exemple, le choix des populations d’acides nucléiques à séquencer, la reproductibilité des analyses ou la disponibilité d’une stratégie permettant de comparer de façon fiable la richesse virale dans différents environnements. Dans le présent travail, le virome associé à des populations végétales échantillonnées dans différents écosystèmes, avec un focus sur les adventices et les plantes sauvages, a été caractérisé par des approches de métagénomique par séquençage haut débit. Dans ces travaux, l’analyse bioinformatique de la richesse du virome a été conduite par deux approches, l’une classique basée sur l’annotation Blast pour l’identification des familles virales présentes dans un échantillon, et l’autre, décrite et validée ici, qui permet de classifier les séquences virales métagénomiques en unités taxonomiques opérationnelles (operational taxonomic units, OTUs) utilisées comme proxy des espèces virales. Toujours dans une perspective méthodologique, les résultats obtenus avec des pools complexes de plantes représentatifs de la diversité végétale au site d’échantillonnage (approche « tondeuse à gazon ») ont permis de comparer les performances des deux techniques actuellement utilisées pour enrichir les séquences virales, la purification d’ARN bicaténaires (double-stranded RNA, dsRNA) ou d’acides nucléiques associés aux virions (virion-associated nucleic acids, VANA). Les résultats obtenus par les deux approches ont mis en évidence des viromes riches mais montrent que l’approche dsRNA devrait être préférée pour l’analyse de tels pools complexes car elle permet de façon reproductible une description plus complète du phytovirome, à l’exception des virus ADN. Les viromes caractérisés montrent, pour les populations végétales de milieux cultivés ou non gérés tempérés échantillonnées, une forte incidence virale (jusqu’à 86.5% dans 126 pools monospécifiques collectés sur une période de deux ans) et confirment la prédominance des virus dsRNA qui représentent plus de 70% des OTU identifiés. Alors qu’une proportion significative des virus ssRNA détectés sont déjà connus, plus de 90% des virus dsRNA détectés sont nouveaux et n’avaient pas été caractérisés auparavant. Un effort important en culturomique visant à comparer le phytovirome avec le mycovirome de cultures fongiques obtenues à partir des mêmes échantillons végétaux a révélé un nombre remarquablement faible d’OTUs partagés, renforçant le questionnement sur la nature, phytovirus ou mycovirus, des virus dsRNA identifiés dans les viromes des plantes. La composition en OTU des viromes analysés s’est révélée variable entre sites d’échantillonnage mais aussi très dynamique dans le temps, avec seulement une très faible fraction des OTUs ré-échantillonnés de façon stable dans la même population végétale sur une période de deux ans. Pris dans leur ensemble, ces travaux exploratoires permettent de mieux raisonner les choix méthodologiques pour l’étude des viromes associés aux plantes et étendent notre connaissance de la diversité des phytovirus, en particulier dans des espèces végétales sauvages largement négligées, apportant des points de référence importants pour de nouveaux travaux en écologie et en évolution virale. / Metagenomics based on high throughput sequencing (HTS) has opened a new era of unbiased discovery and genomic characterization of viruses. As for other viruses, such metagenomic studies indicate that the diversity of plant viruses was until recently far underestimated. As potentially important components of unmanaged and cultivated ecosystems, there is a need to explore the diversity of the viruses associated with plant populations and to understand the drivers shaping their diversity in space and time. At the same time, the development of such studies is still faced by methodological questions concerning, for example, the choice of target nucleic acids populations, the reproducibility of the analyses or the implementation of a strategy to accurately compare virus richness in different environments. In the present thesis the phytovirome associated with plant populations sampled in various ecosystems, with an emphasis on wild plant or weed species was characterized using HTS-based metagenomics. In these experiments, the bioinformatic analysis of the virome complexity was performed using two strategies, a classical one based on Blast-based contigs annotation for the identification of the viral families present in a sample and a novel one, described and validated here, and which allows to classify the metagenomic viral sequences into operational taxonomic units (OTUs) as a proxy to viral species. Also from the methodological perspective, the results obtained using complex plant pools such as those used in the “lawn-mower” sampling strategy allowed to compare the performance of the two currently used viral enrichment methods, double-stranded RNA (dsRNA) or Virion-associated nucleic acids (VANA) purification. The results indicate both of approaches uncovered rich viromes and suggest that the dsRNA approach should be preferred when analyzing complex plant pools since it consistently provided a more comprehensive description of the analysed phytoviromes, with the exception of the DNA viruses. The virome characterization results obtained showed, for the temperate plant populations from unmanaged and cultivated sampling sites, a high virus incidence (up to 86.5% in 126 single species pools collected over a two-year period) and confirmed the predominance of dsRNA viruses with greater than 70% of the phytovirome OTUs. While a significant proportion of detected single-stranded RNA (ssRNA) viruses are already known agents, more than 90% of the dsRNA viruses are novel and had not previously been characterized. A large scale culturomics effort to contrast the phytovirome with the mycovirome of fungal cultures obtained from the same plant samples revealed an extremely low number of shared OTUs, further deepening the debate about the phytovirus or mycovirus nature of the dsRNA viruses identified in plant viromes. The OTU composition of the analyzed phytoviromes varied significantly between sampling sites but was also shown to be highly dynamic over time, with a very low proportion of OTUs consistently re-sampled in the same plant population over a 2 years period. Taken together, these exploratory studies allow a more reasoned choice of methodology for the study of plant-associated viromes and expand our knowledge of plant virus diversity especially in neglected wild plant populations, providing important references for the further viral ecology and evolution studies.
|
13 |
Bioaérosols viraux dans les usines de traitement des eaux usées : détection moléculaire et métagénomiqueBrisebois, Evelyne 11 December 2024 (has links)
Les travailleurs des centres de traitement des eaux usées sont souvent atteints de maladies reliées à l’exposition virale telles que le rhume, la grippe et les infections gastro-intestinales. Dans la littérature, plusieurs études ont caractérisé les bactéries présentes dans les eaux usées ainsi que les bactéries dans les aérosols de ces centres de traitement. Les virus dans les eaux usées ont aussi été dans la mire de certaines études. Cependant, malgré le fait que les maladies affectant les travailleurs soient majoritairement de cause virale et que certains virus pathogènes aient été démontrés pour être capables de se transmettre par l’air, seule une minime quantité d’études a décrit jusqu’à présent les aérosols viraux de ces environnements. Qu’en est-il des virus aérosolisés qui peuvent provoquer ces maladies chez les travailleurs? Auxquels virus potentiellement pathogènes les travailleurs sont-ils exposés chaque jour dans ces environnements de travail? Cette étude avait pour but d’échantillonner l’air de quatre centres de traitement des eaux usées à l’aide de différents échantillonneurs pour décrire la communauté virale dans les aérosols et, ultimement, d’identifier les virus aérosolisés qui peuvent mettre en danger la santé des travailleurs. Onze virus ont été sélectionnés en fonction de leur présence dans les eaux usées et quantifiés de manière spécifique par une technique de biologie moléculaire appelée qPCR. De plus, une étude métagénomique a été effectuée sur des échantillons d’air de très grands volumes dans l’une des usines à l’étude afin de caractériser les communautés virales totales présentes dans l’air des centres de traitement. Les échantillons d’air ont été pris à deux reprises dans chaque centre, une fois durant la saison d’été et une fois durant la saison d’hiver afin de déterminer l’effet de la température de l’eau sur le type de virus aérosolisés. / Wastewater treatment center (WTCs) workers may be vulnerable to diseases caused by viruses, such as the common cold, influenza and gastro-intestinal infections. Although there is a substantial body of literature characterizing the microbial community found in wastewater, only a few studies have characterized the viral component of WTC aerosols, despite the fact that most diseases affecting WTC workers are of viral origin and that some of these viruses are transmitted through the air. In this study, we evaluated in four WTCs the presence of 11 viral pathogens of particular concern in this milieu and used a metagenomic approach to characterize the total viral community in the air of one of those WTCs. The presence of viruses in aerosols in different locations of individual WTCs was evaluated and the results obtained with four commonly used air samplers were compared. We detected four of the eleven viruses tested, including human adenovirus (hAdV), rotavirus, hepatitis A virus (HAV) and Herpes Simplex virus type 1 (HSV1). The results of the metagenomic assay uncovered very few viral RNA sequences in WTC aerosols, however sequences from human DNA viruses were in much greater relative abundance.
|
14 |
Aperçus taxonomiques et génomiques des communautés microbiennes face à un environnement fluctuant dans la Polynie des Eaux du Nord (Canada-Groenland)Freyria, Nastasia J. 02 February 2024 (has links)
En raison de la fonte pluriannuelle des glaces dans l'Océan Arctique et de la fonte de la calotte glaciaire du Groenland, les communautés microbiennes sont exposées à de plus grandes fluctuations de salinité au cours de la saison de croissance et dans de vastes zones géographiques. Les Eaux du Nord très productives ont subi des changements marqués dans les tendances saisonnières de la chlorophylle de surface observées grâce à la télédétection et les données in situ, mais l'interprétation de ces données en termes d'espèces reste difficile puisque la phénologie de la communauté et la variabilité spatio-temporelle sont encore inconnues. Il est essentiel de bien comprendre la dynamique des assemblages de phytoplancton et d'autres espèces microbiennes pour comprendre les réponses des écosystèmes face au changement global. De plus, les grandes fluctuations de salinité ou stress salin et le choc osmotique sont parmi les principaux facteurs environnementaux limitant la croissance et la productivité des plantes et des microorganismes. Pour combler ce manque de connaissance, nous avons premièrement appliqué le séquençage d'amplicon à haut débit pour étudier les communautés microbiennes d'eucaryotes arctiques d'été et d'automne des deux côtés du nord de la baie de Baffin sur plus de 12 ans (2005 à 2018). Ces communautés sont soumises à des régimes de stratification et de courants opposés. Deuxièmement, nous avons étudié la réponse transcriptionnelle d'une microalgue associée à la glace exposée à des salinités progressivement décroissantes afin de mieux comprendre la capacité génétique de cette algue à tolérer les fluctuations de salinité, ainsi que d'identifier les gènes de stress clés. Enfin, nous avons combiné une approche métagénomique comparative avec le séquençage des amplicons d'ARNr 18S pour étudier les capacités fonctionnelles, la diversité et la dynamique des microorganismes dans la colonne d'eau supérieure du nord de la baie de Baffin pendant deux étés consécutifs (2017-2018). Nous avons constaté que la saisonnalité était un facteur majeur déterminant les assemblages de communauté des eaux de surface estivales avec le complexe d'espèces Chaetoceros socialis-gelidus et Micromonas polaris dominant le phytoplancton, et les Alpha et Gammaproteobactéries dominant la communauté bactérienne. En automne, les dinoflagellés d'eau libre non-cultivés et non-décrits étaient favorisés. Nos résultats suggèrent que la production automnale de l'Arctique, due à des conditions d'eau libre plus longue, pourrait ne pas refléter une floraison printanière dominée par les diatomées, comme le prévoient certains scénarios des saisons sans glace plus longues. Par ailleurs, une réponse progressive et une adaptation spécifique aux conditions arctiques froides et salines ont été observées avec l'expression différentielle de plusieurs protéines antigel, comme la protéine de liaison à la glace et une acyl-estérase toutes deux impliquées dans l'adaptation au froid. Nos résultats suggèrent que la protéine de liaison à la glace peut également jouer un rôle crucial dans l'adaptation à un changement rapide de salinité et à la survie cellulaire. Par ailleurs, grâce à l'annotation fonctionnelle, nous avons examiné les gènes impliqués dans la protection des photosystèmes, la régulation osmotique et les protéines antigel, cruciales pour l'acclimatation à un environnement froid. L'utilisation de la génomique comparative permettrait de révéler les évolutions des familles de gènes conférant l'adaptation des microorganismes aux transitions entre eau salée et eau douce. Ce travail de thèse aura des implications non seulement pour l'Arctique où les communautés de surface sont soumises à de grandes fluctuations de salinité, de température et de lumière, mais il contribuera également aux connaissances fondamentales dans les domaines de la production de biocarburants et de la prévision des efflorescences algales potentiellement nuisibles. / As the Arctic Ocean freshens due to multiyear ice and Greenland Ice Sheet melt, the microbial communities are being exposed to greater salinity fluctuations over the growth season and across wide geographic areas. Although remote sensing and limited in situ data have shown that the highly productive North Water has undergone marked changes in the seasonal patterns of surface chlorophyll. Interpreting this data in terms assemblages of species is difficult since the community phenology and spatiotemporal variability is unknown. Understanding the dynamics of phytoplankton and other microbial species assemblages is critical to understand ecosystem responses to global change. Moreover, greater salinity fluctuations or salt stress and osmotic shock are among the main environmental factors limiting the growth and productivity of plants and microorganisms. To address this knowledge gap, firstly, high throughput amplicon sequencing was applied to investigate summer-fall Arctic microbial communities from two sides of Northern Baffin Bay over 12 years (2005 to 2018), that are subjected to very different stratification and major current regimes. Secondly, we investigated the transcriptional response of an ice-associated microalga exposed to progressively decreasing salinities to gain a deeper understanding of the genetic capacity of this alga to tolerate salinity fluctuations, as well as to identify key stress genes. And lastly, we combined comparative metagenomic approach with 18S rRNA amplicon sequencing to investigate the functional capacities, diversity and dynamics of the microorganisms in upper water column of the Northern Baffin Bay during two consecutive summers (2017-2018). We found that seasonality was a major factor determining communities with summer species complex Chaetoceros socialis-gelidus and Micromonaspolaris dominating phytoplankton and Alpha and Gammaproteobacteria dominating bacterial community. In autumn uncultured undescribed open water dinoflagellates were favored. Our results suggest that Arctic autumn production due to longer open water conditions may not mirror a diatom dominated spring bloom as projected in some scenarios of longer ice-free seasons. Furthermore, a gradual response and specific adaptation to cold saline Arctic conditions were seen with differential expression of several antifreeze proteins, an ice-binding protein and acyl-esterase involved in cold adaptation. Our results suggest that ice-binding protein may also have a crucial role for the adaptation of a rapid change of salinity, by providing survival advantage to the cells. Moreover, through functional annotation, we examined potential genes involved in photosystem protection, osmotic regulation and antifreeze proteins, to be crucial for acclimatization to cold environment. The use of comparative genomics would reveal evolutions of gene families conferring adaptation of microorganisms to transitions between salt and fresh water. The combination of these several methodologies provides invaluable insights into the composition, the metabolic repertoire and putative functional profile of a microbial assemblage. This thesis work will have implications not only for the Arctic where surface communities are subject to large fluctuations in salinity and light but will also contribute to fundamental knowledge in the fields of biofuel production and harmful algal bloom prediction.
|
15 |
Métagénomique, culturomique et sélectomique recombinante pour la caractérisation de gènes de résistance aux antibiotiques dans le microbiote intestinal humainBrochu, Eliel 22 June 2024 (has links)
Le microbiote intestinal humain est un important réservoir de gènes de résistance aux antibiotiques qui demeure toutefois méconnu. Dans cette étude, nous avons exploré les gènes de résistance du microbiote intestinal de participants sains avant et après une exposition à l’antibiotique cefprozil. Trois approches ont été utilisées pour caractériser ces gènes et examiner leur altération par les antimicrobiens : la métagénomique, la culturomique et la sélectomique recombinante. Le séquençage métagénomique et la culturomique ont permis d’identifier plusieurs gènes de résistance aux β-lactamines et à d’autres antibiotiques. Cependant, la culturomique a permis d’identifier ces gènes chez un plus grand nombre de participants. La culturomique a mis en évidence la présence de gènes de résistance à la vancomycine de type vanD dans les microbiotes de 46% des participants comparativement à 8% avec le séquençage métagénomique. La culturomique a aussi montré que l’exposition in vitro et in vivo à une β-lactamine stimule l’émergence des gènes vanD. La sélectomique recombinante, qui repose sur la construction de banques d’expression à partir de l’ADN des bactéries, a été utilisée pour caractériser de manière fonctionnelle les gènes de résistance aux β-lactamines chez les bactéries cultivables de l’intestin. Elle a permis d’identifier et caractériser cinq β-lactamases différentes dont deux montrant une activité à spectre étendu. La majorité des gènes de β-lactamases étaient associés à d’autres gènes de résistance et/ou des éléments mobiles. Ces travaux ont montré que la culture favorise l’identification de gènes non détectés par le séquençage métagénomique et que la sélectomique recombinante est un outil puissant pour caractériser les fonctions des gènes. Cette étude a aussi révélé que la prise d’une β-lactamine communément utilisée peut influencer l’abondance des bactéries qui contiennent des gènes de résistance à un antibiotique d’une autre classe, comme la vancomycine, un antibiotique de dernier recours dans l’arsenal des antimicrobiens. / The human intestinal microbiota is an important and poorly known antibiotic resistance genes reservoir. In this study, we explored resistance genes from the microbiota of healthy volunteers before and after exposure to the β-lactam cefprozil antibiotic. Three approaches were used to characterise resistance genes in the human microbiota and examine alteration by antimicrobials: metagenomics, culturomics and recombinant selectomics. Metagenomic and culturomic sequencing of intestinal microbiota enabled identification of several genes for resistance to β-lactams and other antibiotics. However, culturomics allowed identification of these genes in more participants than metagenomics. Culturomics highlighted the presence of the clinically important vancomycin resistance vanD-like genes in the microbiota of about 46% of participants compared to 8% with metagenomics. Culturomics also showed that in vitro and in vivo β-lactams exposition stimulates the emergence of vanD genes. Recombinant selectomics, which is based on the construction of expression libraries made with bacterial DNA, was also used to functionally characterise β-lactam resistance genes from the cultivable intestinal bacteria. It allowed identification and characterisation of five different β-lactamases including two with an extended-spectrum activity. The majority of β-lactamases genes was associated with other resistance genes and/or mobile elements. This study demonstrated that culture favors the identification of genes undetected by direct metagenomic sequencing and selectomics was a powerful tool to characterise gene functions. It also demonstrated that intake of a commonly used antibiotic of the β-lactam family can influence the abundance of bacteria containing resistance genes to an antibiotic from another class, such as vancomycin, which is a last resort antibiotic.
|
16 |
Reconstitution de pan-génomes microbiens par séquençage métagénomique aléatoire : Application à l’étude du microbiote intestinal humain / Abundance-based reconstitution of microbial pan-genomes from whole-metagenome shotgun sequencing data : Application to the study the human gut microbiotaPlaza onate, Florian 10 December 2018 (has links)
L’avènement du séquençage métagénomique aléatoire a révolutionné la microbiologie en permettant la caractérisation sans culture préalable de communautés microbiennes complexes telles que le microbiote intestinal humain. Des outils bioinformatiques récemment développés atteignent une résolution au niveau de la souche en recensant des gènes accessoires ou en capturant des variants nucléotidiques (SNPs). Toutefois, ces outils sont limités par l’étendue des génomes de référence disponibles qui sont loin de couvrir toute la variabilité microbienne. En effet, de nombreuses espèces n’ont pas encore été séquencées ou sont représentées par seulement quelques génomes.La création de catalogues de gènes non redondants par assemblage de novo suivie du regroupement des gènes co-abondants révèlent une partie de la matière noire microbienne en reconstituant le répertoire de gènes d’espèces potentiellement inconnues. Bien que les méthodes existantes identifient avec précision les gènes core présents dans toutes les souches d’une espèce, elles omettent de nombreux gènes accessoires ou les divisent en petits groupes de gènes qui ne sont pas associés aux core génomes. Or, capturer ces gènes accessoires est indispensable en recherche clinique et épidémiologique car ces derniers assurent des fonctions spécifiques à certaines souches telles que la pathogénicité ou la résistance aux antibiotiques.Lors de cette thèse, nous avons développé MSPminer, un logiciel performant qui reconstitue et structure des pan-génomes d’espèces métagénomiques (ou MSPs pour Metagenomic Species Pan-genomes) en regroupant les gènes co-abondants dans un ensemble d’échantillons métagénomiques. MSPminer s’appuie sur une nouvelle mesure robuste de la proportionnalité couplée à un classificateur empirique pour regrouper et distinguer les gènes core mais aussi les gènes accessoires des espèces microbiennes.Grâce à MSPminer, nous avons structuré un catalogue de 9,9 millions de gènes du microbiote intestinal humain en 1 661 MSPs. L’homogénéité de l’annotation taxonomique, de la composition nucléotidique ainsi que la présence de gènes essentiels indiquent que les MSPs ne correspondent pas à des chimères mais à des objets biologiquement cohérents regroupant des gènes provenant de la même espèce. Parmi ces MSPs, 1 301 (78%) n’ont pas pu être annotées au niveau espèce montrant que de nombreux microorganismes colonisant l’intestin humain demeurent inconnus malgré les progrès substantiels des techniques de culture microbienne. Remarquablement, les MSPs capturent bien plus de gènes que les clusters générés par les outils existants tout en garantissant une spécificité élevée.Cet ensemble de MSPs peut d’ores et déjà être utilisé pour le profilage taxonomique et la découverte de biomarqueurs dans des échantillons de selles humaines. Ainsi, nous tirons parti des MSPs pour comparer l’impact sur le microbiote intestinal des deux principaux types de chirurgie bariatrique, la gastrectomie par laparoscopie (LSG) et la dérivation gastrique de Roux-en-Y (LRYGB). Enfin, les MSPs ouvrent la voie à des analyses au niveau souche. Dans une autre cohorte, nous avons mis en évidence l’existence de sous-espèces associées à l’origine géographique de l’hôte en étudiant les profils de présence/absence des gènes accessoires groupés dans les MSPs. / The advent of shotgun metagenomic sequencing has revolutionized microbiology by allowing culture-independent characterization of complex microbial communities such as the human gut microbiota. Recently developed bioinformatics tools achieved strain-level resolution by making a census of accessory genes or by capturing nucleotide variants (SNPs). Yet, these tools are hampered by the extent of available reference genomes which are far from covering all the microbial variability. Indeed, many species are still not sequenced or are represented by only few genomes.Building of non-redundant gene catalogs followed by the binning of co-abundant genes reveals a part of the microbial dark matter by reconstituting the gene repertoire of species potentially unknown. While existing methods accurately identify core genes present in all the strains of a species, they miss many accessory genes or split them into small gene groups that remain unassociated to core genomes. However, capturing these accessory genes is essential in clinical research and epidemiology because they provide functions specific to certain strains such as pathogenicity or antibiotic resistance.In this thesis, we developed MSPminer, a computationally efficient software tool that reconstitutes Metagenomic Species Pan-genomes (MSPs) by binning co-abundant genes across metagenomic samples. MSPminer relies on a new robust measure of proportionality coupled with an empirical classifier to group and distinguish not only species core genes but accessory genes also.With MSPminer, we structured a catalog made up of 9.9 million genes of the human gut microbiota in 1 661 MSPs. The homogeneity of the taxonomic annotation, of the nucleotide composition as well as the presence of essential genes indicate that the MSPs do not correspond to chimeras but to biologically consistent objects grouping genes from the same species. Among these MSPs, 1 301 (78%) could not be annotated at species level showing that many microorganisms colonizing the human intestinal tract are still unknown despite the substantial improvements of microbial culture techniques. Remarkably, MSPs capture more genes than clusters generated by existing tools while ensuring high specificity.This set of MSPs can be readily used for taxonomic profiling and biomarkers discovery in human gut metagenomic samples. In this way, we take advantage of the MSPs to compare the impact of two main types of surgeries, the laparoscopic sleeve gastrectomy (LSG) and the Roux-En-Y gastric bypass (LRYGB). Finally, the MSPs open the way to strain-level analyses. In another cohort, we identified subspecies associated the host geographical origin by studying presence/absence patterns of the accessory genes grouped in the MSPs.
|
17 |
Détermination de sondes oligonucléotidiques pour outils moléculaires à haut débit : application pour le développement d'une nouvelle approche de capture de gènes pour l'écologie microbienne / Selection of oligonucleotide probes for high-throughput molecular tools : application for a new gene capture method’s development for microbial ecologyDenonfoux, Jérémie 09 January 2013 (has links)
Les microorganismes, par leurs fascinantes capacités d’adaptation liées à l’extraordinaire diversité de leurs capacités métaboliques, jouent un rôle fondamental dans les tous les processus biologiques. Ils interviennent notamment au niveau des changements globaux, comme le réchauffement climatique, en partie occasionné par les émissions croissantes de méthane dans l’atmosphère, mais également par les pollutions résultant de la dispersion de molécules comme les Hydrocarbures Aromatiques Polycycliques. Ainsi, les communautés microbiennes vont participer à réduire ou à augmenter les effets délétères de l’anthropisation des écosystèmes. La régulation des changements globaux passe donc par une meilleure connaissance de ces communautés qui doivent être explorées dans leur globalité au sein des environnements. Néanmoins en raison de leur forte complexité, une telle exploration n’est possible qu’en utilisant des outils d’analyse haut-débit. Cependant, l’emploi d’outils moléculaires à haut-débit comme les biopuces à ADN passe par la détermination de sondes combinant à la fois une forte sensibilité, une très bonne spécificité et un caractère exploratoire. Pour concevoir de telles sondes un nouveau logiciel KASpOD a donc été développé. De même, en utilisant des sondes présentant les mêmes caractéristiques, le développement d’une nouvelle approche innovante en écologie microbienne de capture de gènes en solution été entrepris. Cette nouvelle méthode d’enrichissement de gènes d’intérêt couplée à du séquençage haut-débit a été appliquée pour l’exploration des communautés méthanogènes du lac Pavin. Les résultats obtenus montrent la pertinence de l’approche qui assure une meilleure évaluation de diversité de l’écosystème avec notamment l’identification de populations appartenant à la biosphère rare. L’autre ajout majeur de cette approche est qu’elle autorise l’identification de grandes régions d’ADN génomique exploitable pour caractériser de nouveaux gènes ou de nouveaux processus adaptatifs. / Microorganisms play a crucial role in all biological processes related to their huge metabolic potentialities. They are involved in global changes such as global warming partially caused by the growing methane emissions in the atmosphere, but also by the release of pollutants such as Polycyclic Aromatic Hydrocarbons. Thus, microbial communities will contribute to reduce or increase the negative effects of human impacts on ecosystems. The regulation of global changes needs a better knowledge of the microbial communities involved in complex environments functioning. Nevertheless, a complete exploration of such environments requires the use of high-throughput tools, due to the extraordinary diversity of microorganisms within the ecosystems. The use of DNA microarrays requires a probe design step allowing the selection of highly sensitive, specific and explorative oligonucleotides. For this purpose, we have developed KASpOD, a new software, allowing the generation of efficient probes dedicated to environmental applications. Using high quality probe sets, an innovative in solution-based gene capture method combined with Next Generation Sequencing, was developed and applied for the exploration of the methanogen communities in lake Pavin, Results showed the relevance of this approach that allows a better evaluation of the methanogen diversity with an efficient detection of populations belonging to the rare biosphere. The other main advantage of this approach is the identification of large regions of genomic DNA, useful for the characterization of new genes or adaptive processes.
|
18 |
Analyse spatiale et multi-échelle de la distribution des bactéries dans le sol et les sédiments / Multi-scale spatial analysis of microbial distribution in soil and sedimentBeaulne, Jean-Sébastien 20 November 2015 (has links)
Les bactéries ont colonisé toutes les niches écologiques de la planète. Plus précisément, les sols sont l’hôte de la plus grande biodiversité terrestre, la faune microbienne. Cette grande diversité de bactéries et leur relative ubiquité rendent difficile l’identification des variables contrôlant la distribution spatiale des bactéries vivant dans le sol. Comme les bactéries du sol jouent un rôle important dans les grands cycles biogéochimiques globaux, il est important de mieux comprendre les variables qui peuvent influencer la composition bactérienne des sols. Dans cette thèse, nous émettons l'hypothèse que l'hétérogénéité de la composition de la communauté bactérienne apparaît à la même échelle spatiale que l'hétérogénéité des propriétés physico-chimiques du sol. Afin de comprendre la relation entre la composition bactérienne des sols (à l’échelle d’une carotte de sol jusqu’à l’échelle d’une région entière du nord de la France) et les paramètres physico-chimiques du sol à différentes échelles spatiales, nous allons utiliser une approche intégrant des données issues d’analyses SIG (Système d’Information Géographique), d’analyses physico-chimiques du sol et d’analyses des communautés bactériennes du sol. A travers une suite de trois expérimentations, nous allons répondre à trois questions: Est-ce qu’une pression environnementale uniforme à une plus grande échelle (cm) peut atténuer l’hétérogénéité microbienne à micro-échelle? Est-ce que les variables ayant une distribution spatiale suivant un gradient géographique sont des variables structurant fortement la distribution spatiale des bactéries à l’échelle de ce même gradient? Est-ce que certains bio-indicateurs à grandes échelles peuvent intégrer des groupes de variables pour modéliser la distribution des bactéries pour une région entière ? / The bacteria have colonized all the niches of the planet. Specifically, soils are home of the largest terrestrial biodiversity, microbial fauna. This great diversity of bacteria and their relative ubiquity make it difficult to idendified variables driving the spatial distribution of bacteria living in the soil. As soil bacteria play a significant role in the main global biogeochemical cycles, it is important to better understand the variables that can influence bacterial composition of soils. In this thesis, we hypothesize that heterogeneity of the bacterial community composition appears at the same scale level as the heterogeneity of soil physicochemical properties. In order to understand the relationship of bacterial composition of soils (from core experiment to field study in large region in the northern France) and soil factors at different spatial scales, we will use an approach coupling GIS tools, soil physico-chemical analysis and 16S rRNA gene NGS. With Three set of experiment we will answer three questions: Can a uniform environmental pressure at a larger scale (cm) overcome microbial micro-scale heterogeneity? Are geographical gradients strong drivers of the microbial community structure at the scale of the gradient? Do large-scale geographical features that integrate groups of parameters model the differences in microbial community structure for an entire region?
|
19 |
Approche métagénomique de la chimiosynthèse en système hydrothermal océanique profond : cas particulier des symbioses bactériennes associées à la crevette Rimicaris exoculata / The metagenomic approach of chemosynthesis in deep oceanic hydrothermal systems : the case of bacterial symbiosis associated with shrimp Rimicaris exoculataJan, Cyrielle 19 December 2012 (has links)
La crevette hydrothermale Rimicaris exoculata est une espèce endémique des sites hydrothermaux de la ride médio-atlantique (MAR). Cette espèce vit en agrégats denses sur les parois des cheminées hydrothermales actives et domine la mégafaune de la plupart de ces sites. Cette crevette abrite deux communautés microbiennes distinctes dont les rôles demeurent partiellement élucidés. Une de ces communautés est associée à la cavité céphalothoracique et aux pièces buccales hypertrophiées. Celles-ci sont recouvertes par une importante communauté épibionte correspondant à des bactéries chimioautotrophes associées à des dépôts minéraux. Afin d’approfondir notre connaissance de cette communauté symbiotique et dans le cadre de la thèse, une approche de métagénomique a été entreprise.Celle-ci a permis de mettre en évidence la diversité microbienne présente, avec un phylum dominant, celui des Protéobactéries. Au sein de ce phylum, deux classes sont dominantes, les Gamma- et les Epsilonproteobacteria, d’autres classes sont également présentes, les Alpha-, Delta- et Beta-proteobacteria.Une nouvelle classe de Protéobactéries, les Zetaproteobacteria, très récemment décrite comme bactéries libres dans l'environnement hydrothermal, a été mise en évidence. Les types métaboliques bactériens ont également pu être étudiés de façon plus approfondie permettant d’avancer encore davantage dans la compréhension de la symbiose entre la crevette et les microorganismes s’y développant. Il a notamment été possible de reconstituer des voies métaboliques entières pour chaque épibionte principal (à savoir Epsilon-et Gammaproteobacteria) ainsi que d'étudier des gènes impliqués notamment dans la réponse aux fluctuations environnementales, dans la communication cellulaire et le quorum-sensing. Le groupe des Zetaproteobacteria a également été étudié, tout d'abord dans le cadre de l'analyse métagénomique, mais également par des approches moléculaires sur des spécimens provenant de plusieurs sites hydrothermaux de la MAR, et ce, afin de mieux définir l'association possible entre ces bactéries ferro-oxydantes et R. exoculata. La seconde communauté associée à R. exoculata réside dans le tractus digestif. Des analyses complémentaires aux précédentes études ont été menées lors de ce travail de thèse combinant notamment approche métagénomique et culturale. / The hydrothermal shrimp Rimicaris exoculata is an endemic species of the Mid-Atlantic Ridge (MAR).This species lives in dense aggregates on the walls of active chimneys and dominates the megafauna of most of these sites. This shrimp has two distinct microbial communities whose roles remain almost unknown. One of these communities is associated with the cephalothorax and hypertrophied mouthparts.These are covered by a dense community of bacteria affiliated to chemoautotrophic epibionts associated with mineral deposits. To deepen our knowledge on the symbiotic community in the context of the thesis, a metagenomic approach was undertaken. This helped highlighting the microbial diversity present with a dominant phylum, the Proteobacteria. Two classes are dominant, Gamma-and Epsilonproteobacteria, other classes are also present. A new class of Proteobacteria, the Zetaproteobacteria very recently described as free living in hydrothermal environments, was identified. Bacterial metabolic types have also been studied in more detail via the metagenome to advance further in the understanding of the symbiosis. It has been possible to reconstruct metabolic pathways for each main epibiont (i.e. Epsilon- and Gammaproteobacteria), and to study genes in response to environmental fluctuations, in cell communication and quorum-sensing. The Zetaproteobacteria group has also been studied, first in the context of metagenomic analysis, but also using molecular approaches on several specimens from the MAR hydrothermal sites, to better define the possible association between R. exoculata and iron-oxidizing bacteria. The second community associated with R. exoculata is located in the digestive tract. Additional analyzes to previous studies have been conducted in this thesis including a metagenomic approach and cultures.
|
20 |
Diversité, évolution et écologie virale : des communautés aux génotypes. Analyse bioinformatique de métagénomes viraux / Viral diversity, evolution and ecology : from communities to genotypes. Bioinformatic analysis of viral metagenomesRoux, Simon 03 October 2013 (has links)
Les virus sont omniprésents dans la biosphère et infectent vraisemblablement l'ensemble des êtres vivants. Au sein des écosystèmes, ils ont ainsi un impact sur la diversité des populations microbiennes, l'évolution des génomes de ces populations, et directement ou indirectement sur les cycles biogéochimiques majeurs. Leur caractère protéiforme et l'absence de marqueur unique (tant génétique que physique) font toutefois de l'exploration de la diversité virale une tâche complexe, de telle sorte que nos connaissances sur ces communautés virales environnementales sont encore très limitées. La métagénomique, ou séquençage massif et aléatoire de fragments nucléotidiques extraits d'un prélèvement, offre un point de vue unique sur les génomes viraux. Ce type d'approche, récemment développé, a ainsi mis en évidence la richesse extraordinaire des populations virales environnementales, tant du point de vue des gènes que des génotypes. C'est dans ce cadre de l'étude des communautés virales de l'environnement par métagénomique que se sont inscrits les travaux de cette thèse, organisée autour de quatre axes principaux : • Le développement de nouvelles méthodes d'analyses adaptées aux spécificités des génomes et métagénomes viraux par la mise en place du serveur web Metavir, premier serveur dédié à l'analyse des viromes. Proposant aujourd'hui un ensemble cohérent d'outils pour différents types de viromes, Metavir compte plus de 300 utilisateurs pour plus de 2000 viromes analysés. • Le potentiel fonctionnel des génomes viraux a pu être approché par l'étude conjointe d'un ensemble de viromes. Après une analyse rigoureuse des contaminations potentielles, nous avons pu confirmer que les génomes viraux comprenaient un ensemble limité mais non négligeable de gènes associés au métabolisme cellulaire. La plupart des virus agissent ainsi certainement directement sur le métabolisme de la cellule hôte durant l'infection. • La prépondérance des paramètres environnementaux, et particulièrement de la salinité, en tant que facteurs structurant les communautés virales aquatiques a également pu être mise en avant. La distance géographique entre prélèvements semble n'avoir qu'une influence secondaire, confirmant la capacité importante de dispersion des capsides virales. Une adaptation locale semble toutefois exister dans certains cas, notamment en cas de compétition importante entre les résistances développées par les hôtes et les capacités d'infection des virus. • Enfin, différentes familles de petits virus à ADN simple brin ont pu être caractérisées par une méta-analyse de viromes. Leur apparente simplicité a ainsi révélé des mécanismes d'évolution plus complexes que prévus, impliquant différents cycles et capacités de transfert de gènes jusqu’ici plutôt considérés comme l'apanage des virus à ADN double brin, et remettant en cause les séparations admises entre les différents groupes de virus sur la base de la nature de leur génome. En permettant une étude depuis l'échelle de la communauté jusqu'à des génotypes spécifiques, les viromes constituent des outils de choix pour caractériser la diversité virale, appréhender les différents facteurs régulant ces communautés, et ainsi mieux comprendre la place des virus dans la biosphère. De plus, ces études ont confirmé l'existence d'interactions étroites entre virus et organismes cellulaires, ces interactions semblant nombreuses, multiples dans leurs natures et conséquences, et présentes tout au long de l'histoire du vivant. Ces nouvelles connaissances apportées par l'analyse de viromes permettent donc d'aborder certaines questions fondamentales concernant l'origine des grandes innovations évolutives ou le fonctionnement global des écosystèmes. / Viruses likely infect every organism on Earth (in some cases even other viruses!), and represent vast morphological and genetic diversity. Not surprisingly given their numerical dominance, viruses significantly impact ecosystems through regulating microbial populations, driving major biogeochemical cycles, and shaping the evolution of hosts genomes. However, our understanding of viruses in nature is primitive, especially because the majority of environmental viral genomes remains uncharacterized. Metagenomics (i.e. random and massive sequencing of genomic fragments isolated from a sample) applied to encapsidated genetic templates provides a unique perspective on the viral pangenome. The first viral metagenomes (or viromes) generated entire sets of new questions about viral diversity, especially concerning their genetic and species richness. This work was set within this frame of viral diversity study through metagenomics, and organized into four main themes : • The development of bioinformatics tools adapted to the specific features of viral genomes and metagenomes led to the release of Metavir, the first web server dedicated to virome analysis. Providing a comprehensive set of connected tools, Metavir has now been used by more than 300 users in the analysis of more than 2000 viromes. • The functions encoded within viral genomes were for the first time thoroughly examined, following a rigorous examination of a set of published viromes toward contamination by cellular DNA. A new picture of the viral functional potential could thus be drawn, which confirmed that the range of cellular functions encoded in viral genomes is wider than the one retrieved from the complete genomes currently available, though not as great as previously estimated. • The study of the aquatic viral metagenomes also revealed the importance of salinity in the distribution of viral communities across the globe. The ubiquitous distribution of most viral genotypes confirmed that viral particles seem to be able to move across any distance on Earth. Viruses are thus likely selected based on factors such as the presence of their host in the samples and the competition with other parasites, which can still drive local adaptations. • Finally, viromes were used to better characterize the diversity of different ssDNA viral families. Despite their small size and relative simplicity, these viruses were found to harbor unexpectedly complex cycles and evolutionary mechanisms, in particular a great potential of recombination and gene transfer. Overall, the new genomes assembled from viromes notably challenge the separation between viruses based on the nature of their genome. Eventually, as illustrated by these different works and analyses, viromes are unique and extremely powerful tool to assess and characterize viral genetic diversity. Moreover, considering the tight links between viral and cellular worlds, insights into the viral communities provided by metagenomics make it possible to address fundamental questions such as the origin of important evolutive innovations or the functioning of ecosystems, so that these results are of interest for the whole field of biology.
|
Page generated in 0.0592 seconds