• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • 4
  • Tagged with
  • 8
  • 8
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Dynamique de la structure des génomes et de leur biogéographie dans l’océan : analyses comparatives des données métagénomiques du projet Tara Oceans pour l’étude de la microalgue Bathycoccus et des communautés planctoniques globales / Dynamic of the structure of the genomes and of their biogeography : comparative analysis of Tara Oceans metagenomic data to study the Bathycoccus microalgeae and global planktonic communities

Vannier, Thomas 21 March 2017 (has links)
Le plancton représente l’ensemble des organismes qui dérivent le long des courants marins. Par sa partie phytoplancton, il produit autant d’oxygène que toutes les plantes terrestres et est, à travers le cycle du carbone, un important régulateur de la machine climatique ainsi que de l’acidité des océans. De plus, il est à la base de la chaîne alimentaire. L’écosystème planctonique joue donc un rôle important dans les équilibres nécessaires à la vie sur Terre. Pourtant, celui-ci reste peu connu. Avec le développement du séquençage haut débit et de la métagénomique, il est maintenant possible d’étudier les séquences d’ADN des micro-organismes présents dans des échantillons issus de l’océan. Le projet Tara Oceans (2009-2012) est la première expédition à avoir réalisé une collecte et un séquençage des micro-organismes planctoniques présents dans les eaux de surface à l’échelle de la planète tout en intégrant des mesures environnementales.Cette thèse consiste à étudier l’organisation génomique de l’écosystème planctonique dans les eaux océaniques de surface. Pour cela, il a été utilisé les séquences d’ADN de 644 échantillons métagénomiques correspondant à 6 fractions de taille d’organisme planctonique, allant des virus aux petits métazoaires, ainsi que les données environnementales des 113 stations Tara Oceans correspondantes. L’objectif étant de mieux comprendre dans quelle mesure l’organisation génomique et spatiale à l’échelle des individus ainsi qu’à celle des communautés micro-planctoniques est influencée par la circulation océanique et les variations environnementales.L’étude de la diversité génomique et spatiale du phytoplancton Bathycoccus prasinos a été réalisée à partir des séquences du génome de référence et d’une partie d’un second génome obtenu lors de l’expédition par une méthode d’amplification à cellule unique (SAG). La comparaison de ces deux génomes partageant la même séquence de l’ARNr 18S a révélé qu’il s’agissait de deux espèces distinctes de Bathycoccus. Une analyse de métagénomique ciblée a permis de décrire la biogéographie de ces deux écotypes qui sont présents dans des environnements différents. Enfin, cette analyse a révélé une variabilité du contenu en gènes dans les différents échantillons ce qui induit une grande plasticité génomique au sein d’une même espèce.Il est nécessaire de passer a un niveau global pour étudier l’organisation des communautés planctoniques dans les océans. La métagénomique comparative sur l’ensemble des échantillons Tara Oceans et sur les différentes fractions de tailles d’organismes permet ce passage à large échelle. L’évaluation de l’outil Compareads permettant de connaître la similarité en lectures entre deux jeux de données métagénomiques a été réalisée sur une partie des échantillons du projet Tara Oceans. Cette analyse a montré qu’il était possible avec les données métagénomiques d’étudier les modifications de la diversité génomique des communautés micro-planctoniques dans différents océans. L’analyse de la variabilité génomique le long de grands courants océaniques est alors envisageable. Un travail collaboratif pour l’amélioration de Compareads a permis le développement de l’outil COMMET qui, associé à des super calculateurs permet de réaliser les comparaisons de l’ensemble des échantillons Tara Oceans. Avec une heuristique similaire, le calcul de distances de diversité beta entre les échantillons métagénomiques a permis de proposer la première biogéographie des communautés virales, bactériennes et eucaryotes. Il a été démontré que les courants océaniques et les variations physico-chimiques ont un impact différent sur l’organisation génomique des communautés micro-planctoniques qui serait plus ou moins important selon l’échelle de temps et la taille des micro-organismes. / Plankton is composed of all organisms that drift along the currents. Through its phytoplankton part, it produces as much oxygen as all terrestrial plants and it is an important regulator of the climatic system as well as the acidity of the oceans. It is also at the base of the food web. The planktonic ecosystem plays an important role in the necessary balances for life on Earth, however it remains poorly know. With the progress of high-throughput sequencing in the last few years and with the metagenomic approach it is possible to study the DNA sequences of micro-organisms directly sampled from the ocean. The Tara Oceans expedition (2009-2012) performed a vast sampling expedition of plankton in all oceans that collected in situ environmental parameters and sequenced planktonic organisms from surface water.This thesis consists in studying the genomic organization of the planktonic ecosystem in the surface ocean waters. For this purpose, the DNA sequences of 644 metagenomic samples corresponding to 6 plankton size fractions, ranging from viruses to the small metazoan, as well as environmental data from the 113 corresponding Tara Oceans stations are used. The aim is to understand at the scale of individual organism and of global micro-planktonic communities how the genomic structure and the geographic distribution is influenced by ocean circulation and environmental variations.The study of the genomic and geographic diversity of the phytoplankton Bathycoccus prasinos was done using the sequences of a reference genome and a part of a second genome obtained during the expedition with the Single Amplification Genome method (SAG). The comparison of these two genomes sharing the same 18S rRNA revealed that they were two distinct species of Bathycoccus. A targeted metagenomic analysis helped to describe the biogeography of these two ecotypes that are present in different environments. Finally, this analysis showed variability in the gene content in samples which shows the existence of a strong genomic plasticity within species.It is necessary to scale up to global scale to study the plankton community’s organization in the oceans. The comparison of metagenomes of all Tara Oceans samples and at different size fractions of organisms allows this passage to a large scale. The evaluation of Compareads, a tool allowing us to know the similarity between two metagenomic dataset was done on a part of the Tara Oceans samples. This analysis showed the possibility to study the changes of genomic diversity of micro-planktonic communities in different oceans. Analysis of genomic variability along major ocean currents is then possible. The tool COMMET is an upgrade of Compareads which, combined with supercomputer makes it possible to carry out the comparisons of all the Tara Oceans samples. With a similar approach, the beta diversity distances between metagenomic samples made it possible to propose the first biogeography of the viral, bacterial and eukaryotic communities. It has been shown that ocean currents and physico-chemical variations have a different impact on the genomic organization of the microplanktonic communities, which would be more or less important depending on the time scale and the micro-organisms size fraction.
2

Global Diatom Biodiversity : An Assessment Using Metabarcoding Approach / Diatomées biodiversité mondiale : une évaluation utilisant une approche metabarcoding

Malviya, Shruti 20 May 2015 (has links)
Les diatomées (Stramenopiles, Bacillariophyceae) jouent un rôle important sur le plan écologique et sont l'un des groupes phytoplanctoniques les plus divers, avec environ 1800 espèces planctoniques estimées. Bien que largement étudiées, leurs modèles de diversité et de distribution biogéographique ne sont pas bien connus. L'avènement du séquençage de l'ADN à haut débit a révolutionné les études de biodiversité moléculaire facilitant la compréhension de la biogéographie, de la structure des communautés et des processus écologiques. Les deux principaux objectifs de cette thèse sont (1) d'enquêter sur les modèles de la biodiversité mondiale et la structure des communautés de diatomées planctoniques à travers les océans du monde, et (2) de comprendre les mécanismes et processus déterminants la structure de la communauté. Cette thèse présente également une première tentative de discerner la répartition des espèces rares dans les communautés de protistes. L'étude a été réalisée en utilisant les données de metabarcoding générées à partir des échantillons biologiques et des données environnementales associées recueillies au cours de la campagne Tara Oceans (2009-2013), une circumnavigation globale couvrant toutes les principales provinces océaniques. Le matériel d’étude pour cette thèse est constitué d’un total de 12 millions de séquences de la sous unité V9 du 18S ribosomal (barcode), récoltées à partir de 46 stations soit 293 échantillons. Basée sur 63371 metabarcodes de diatomées uniques, cette étude présente une évaluation approfondie de la distribution mondiale des diatomées et de leur diversité. Les analyses révèlent des faits marquants liées à la biogéographie des diatomées, par exemple une nouvelle estimation du nombre total d'espèces de diatomées planctoniques, une diversité considérable inconnue, une diversité exceptionnellement élevée en haute mer, et des patrons de diversité complexes entre les provinces océaniques. La thèse examine ensuite les facteurs qui déterminent les modèles de bêta-diversité. Les résultats suggèrent que les diatomées sont des communautés structurées et réglementées par l'hétérogénéité de l'environnement et des processus spatiaux. Néanmoins, la majorité de la variation totale dans la composition de la communauté ne peut être expliquée ni par les facteurs environnementaux, ni par les distances spatiales, ce qui justifie les analyses futures se concentrant sur les interactions biologiques, les événements historiques, et d'autres facteurs qui ne sont pas considérés. La thèse décrit en outre une approche pour caractériser les clusters significativement associés de ribotypes concomitants. Enfin, une étude préliminaire de communautés de protistes fractionnées par taille révèle que la queue (de leurs distributions rang abondance) semble suivre un comportement en loi de puissance dans presque toutes les communautés de protistes. Cette observation peut indiquer un mécanisme universel potentiel qui peut expliquer l'organisation de communautés planctoniques marines. De façon générale, ce travail présent une perspective globale et complète de la distribution et de la diversité des diatomées dans les océans du monde. La thèse propose un cadre global pour l'évaluation de la diversité mondiale basée sur le metabarcoding, qui pourra être utilisé pour étudier la distribution et la diversité des autres lignées taxonomiques. Par conséquent, ce travail fournit un point de référence pour explorer comment les communautés microbiennes feront face à la variation des conditions environnementales. / Diatoms (Stramenopiles, Bacillariophyceae) are an ecologically important and one of the most diverse phytoplanktonic groups, with an estimated ~1,800 marine planktonic species. Although widely studied, their diversity and biogeographic distribution patterns are not well known. The advent of high-throughput DNA sequencing has revolutionized molecular biodiversity studies facilitating the understanding of biogeography, community assembly and ecological processes. The two major goals of this thesis are (1) to investigate global biodiversity patterns and structure of marine planktonic diatom communities across the world’s oceans, and (2) to understand the mechanisms and processes determining their community structure and assembly. This thesis also presents an initial attempt to discern the distribution of rare species in protist communities. The study was conducted using the metabarcoding data generated from the biological samples and associated environmental data collected during the Tara Oceans (2009-2013) global circumnavigation covering all major oceanic provinces. A total of ~12 million diatom V9-18S rDNA tags from 46 sampling stations, constituting 293 size fractionated samples represent the study material for the thesis. Using 63,371 unique diatom metabarcodes, this study presents an in-depth evaluation of global diatom distribution and diversity. The analyses study draw a number of revelations related to diatom biogeography, e.g. a new estimate of the total number of planktonic diatom species, a considerable unknown diversity, exceptionally high diversity in the open ocean, complex diversity patterns across oceanic provinces. The thesis then looks into the factors determining the beta-diversity patterns. The results suggest that diatoms represent biogeographically structured ecological communities regulated by both environmental heterogeneity and spatial processes. Nonetheless, the majority of the total variation in community composition remained unexplained by either the examined measured environmental factors or spatial distances, which warrants future analyses focusing on biological interactions, historical events, and other factors that are not considered. The thesis further outlines an approach to characterize significantly associated clusters of co-occurring ribotypes. Finally, a preliminary study of size-fractionated protistan communities reveals that the tail (of their rank-abundance distributions) appears to follow a power-law behavior in almost all protistan communities. This observation may indicate a potential universal mechanism which can explain the organization of marine planktonic communities. In general, this work has presented a global comprehensive perspective on diatom distribution and diversity in the world’s oceans. The thesis offers an overall framework for metabarcoding-based global diversity assessments which in turn can be employed to study distribution and diversity of other taxonomic lineages. Consequently, this work provides a reference point to explore how microbial communities will respond/change in response to environmental conditions.
3

Comparaison de novo de données de séquençage issues de très grands échantillons métagénomiques : application sur le projet Tara Oceans / De novo comparision of huge metagenomic experiments coming from NGS technologies : application on Tara Oceans project

Maillet, Nicolas 19 December 2013 (has links)
La métagénomique vise à étudier le contenu génétique et génomique d'un échantillon provenant d'un environnement naturel. Cette discipline récente s'attache à étudier les génomes de différents organismes provenant d'un même milieu. La métagénomique pose de nouvelles questions, tant d'un point de vue biologique qu'informatique. Les masses de données générées par les études métagénomiques et la complexité des milieux étudiés, nécessitent de développer de nouvelles structures de données et de nouveaux algorithmes dédiés. Parmi les différentes approches existantes en métagénomique, la métagénomique comparative consiste à comparer plusieurs métagénomes afin d'en connaître les divers degrés de similarité. Lorsque cette comparaison se base uniquement sur le contenu brut des échantillons, sans faire appel à des connaissances externes, on parle de métagénomique comparative de novo. L'objectif des travaux que nous proposons est de développer une méthode permettant d'extraire les séquences similaires de deux jeux de données métagénomiques, où chaque jeu peut être composé de centaines de millions de courtes séquences. La comparaison proposée consiste à identifier les séquences d'un premier jeu similaires à au moins une séquence d'un second jeu. Afin d'être rapide et économe en mémoire, l'implémentation de notre méthode a nécessité la conception d'une nouvelle structure d'indexation, basée sur le filtre de bloom. Le logiciel final, nommé Compareads, a une consommation mémoire faible (de l'ordre de quelques go) et peut calculer l'intersection de deux échantillons de 100 millions de séquences chacun en une dizaine d'heures. Notre méthode est une heuristique qui génère un faible taux de faux positifs. Le logiciel Compareads est dédié à l'analyse de grands jeux de données métagénomiques. À l'heure actuelle, il est le seul outil capable de comparer de tels jeux. Compareads a été appliqué sur plusieurs projets métagénomiques. Notre outil produit des résultats robustes, biologiquement exploitables et en accord avec diverses méthodes fondamentalement différentes. Il est actuellement utilisé de manière intensive sur les échantillons provenant de l'expédition tara oceans. Sur ce projet, notre méthode à permis de mettre en évidence que les grands systèmes océaniques influent sur la répartition globale des micro-organismes marins. / Metagenomics studies overall genomic information of multiple organisms coming from the same biotope. The information is generally provided by next generation sequencing technologies (NGS). Typical data are samples of short reads (i.e. reads of few hundred base pairs). To study such metagenomics information, we developed an original method for extracting similarities between two samples of reads. More precisely, this approach locates the set of common reads present in two samples. In order to fit with current memory capacities and to be time efficient, we used a modified Bloom filter data structure. Finding the common reads between multiple samples and crossing this information with the location of samples leads to visualize some biological processes like ubiquitous species or effect of water stream caring some species. Finally, the tool can also be used as a filter on metagenomics datas to remove for example only one specie. Our software, Compareads, is actually used on the Tara Oceans project where it shows that global dynamic of oceans seems to play a part on the dispersion of marine microorganisms.
4

Patrons de biodiversité a` l'échelle globale chez les dinoflagellés planctoniques marins / Patterns of biodiversity on a global scale in marine planktonic dinoflagellates

Le Bescot, Noan 10 March 2014 (has links)
Les dinoflagellés forment un groupe complexe de protistes avec une grande diversité de morphologies, physiologies, et cycles de vies qui leur confèrent une forte capacité d'adaptation à l'ensemble des milieux (marins et dulçaquicoles) et habitats (pélagiques et benthiques) aquatiques rendant difficile l¿étude de leur diversité et de leur écologie. L'objectif de cette thèse a été la recherche de patrons globaux de biodiversité et de structuration des communautés de dinoflagellés pélagiques marins à l'échelle planétaire. Un protocole d'échantillonnage morphogénétique, couvrant la totalité de leur spectre de taille et une partie importante de leurs variabilités spatio-temporelles, a été développé (Tara-Oceans). Divers outils d'acquisition automatique à haut débit des données ont été testés. La diversité, l'abondance relative et la distribution géographique des espèces du genre Neoceratium ont été évaluées en mer Méditerranée par FlowCAM. Une étude de la structuration de la biodiversité a été réalisée par metabarcoding de l¿ADNr 18S (fragment V9). La construction d'une base de séquences ADNr de référence (DinR2) a permis l¿assignation taxonomique des metabarcodes environnementaux. L¿approche par metabarcode révèle une diversité remarquable et insoupçonnée des pico-dinoflagellés (<5µm) et que, indépendamment de l'écosystème étudié et de la période d'échantillonnage, l¿abondance des différents ordres dépend essentiellement de la taille (pico-, nano-, micro-, et meso-plancton). La structuration des communautés de dinoflagellés de différentes fractions de tailles de la zone photique a été confrontée à certains facteurs environnementaux ouvrant des pistes de recherche prometteuses / Dinoflagellates form a complex group of protists with a variety of morphologies, physiologies, and life cycles that give them a strong adaptation to all aquatic environments (marine and freshwater) and habitats (pelagic and benthic) making difficult to study their diversity and ecology. The objective of this thesis was the search for global biodiversity patterns and community structure of marine pelagic dinoflagellates across the world?s oceans. A morphogenetic sampling protocol, covering the entire spectrum of their size and an important part of their spatio-temporal variability, was developed (Tara-Oceans). Various tools for an automatic acquisition broadband data were tested. Diversity, relative abundance and geographical distribution of the genus Neoceratium were evaluated by FlowCAM in Mediterranean Sea. A study of the structure of biodiversity was conducted by metabarcoding with 18S rDNA (V9 fragment). Building a base of rDNA reference sequences (DinR2) allowed the taxonomic assignment of environmental metabarcodes. The metabarcode approach reveals a remarkable and unexpected diversity of pico-dinoflagellates (<5?m) and, regardless of the studied ecosystem and the sampling period, that abundance of different levels mainly depends to the size fractions (pico-, nano-, micro- and meso- plankton). Structuring of dinoflagellates communities in different size fractions of the photic zone was facing to some environmental factors and opens promising avenues for research
5

Adaptation à la niche écologique chez deux représentants majeurs du phytoplancton marin, Synechococcus et Prochlorococcus : des gènes à l'écosystème / Niche adaptation in two major members of marine phytoplankton, Synechococcus and Prochlorococcus : from genes to ecosystem

Doré, Hugo 14 December 2017 (has links)
Les picocyanobactéries marines Prochlorococcus et Synechococcus sont les organismes photosynthétiques les plus abondants sur la planète et sont présentes dans presque tous les océans. Au cours de cette thèse, j'ai cherché à mieux comprendre les liens entre diversité génétique et adaptation à la niche écologique chez ces deux genres. Tout d'abord, l'étude de la répartition des populations de picocyanobactéries à l'échelle mondiale à l'aide d'un marqueur taxonomique très résolutif m'a permis de définir des unités taxonomiques écologiquement significatives, et d'identifier les principaux facteurs abiotiques influençant leur répartition. La deuxième partie de ce travail a visé à identifier les bases génétiques de l'adaptation des picocyanobactéries marines à des niches écologiques distinctes. L'étude comparative de 81 génomes non-redondants de ces organismes a révélé le rôle combiné des gains et pertes de gènes et des substitutions d'acides aminés dans la diversification des deux genres, et l'analyse de la répartition des gènes de picocyanobactéries marines dans l'océan mondial m'a permis de montrer que chaque communauté, adaptée à un environnement donné, possède un répertoire de gènes distinct. Enfin, le dernier volet de cette thèse a consisté en la caractérisation physiologique et transcriptomique de cinq souches de Synechococcus soumises à des stress lumineux et thermique afin d'analyser la variabilité écotypique de la réponse au stress. Les résultats obtenus au cours de cette thèse ont donc permis d'améliorer notre connaissance des niches écologiques occupées par les picocyanobactéries marines, et de mieux comprendre les mécanismes leur ayant permis de s'y adapter. / The marine picocyanobacteria Synechococcus and Prochlorococcus are the two most abundant photosynthetic organisms on earth and are present in almost all oceans. During this PhD thesis, I explored the links between genetic diversity and niche adaptation in these two genera. First, the analysis of the distribution of picocyanobacterial populations at the global scale using a high-resolution taxonomic marker allowed me to define ecologically significant taxonomic units, to improve the delineation of their ecological niches and to identify the main abiotic factors influencing their in situ distribution. The second part of this work aimed at identifying the genetic bases of adaptation of marine picocyanobacteria to distinct niches. The comparative analysis of 81 non-redundant genomes of these organisms revealed the combined role of gene gains and losses and of substitutions in protein sequences in the diversification of both genera, and the analysis of the distribution of all known picocyanobacterial genes in the global ocean allowed me to show that each community, adapted to specific environmental conditions, possesses a distinct gene repertoire. Finally, the last part of this work has consisted in the physiological and transcriptomic characterization of five Synechococcus strains, which were submitted to light and thermal stresses in order to better understand the ecotypic variability of the stress response in this genus. Altogether, results obtained during this PhD provided many new insights into the ecological niches occupied by marine picocyanobacteria and the mechanisms allowing them to adapt to these various niches.
6

Comparaison de novo de données de séquençage issues de très grands échantillons métagénomiques : application sur le projet Tara Oceans

Maillet, Nicolas 19 December 2013 (has links) (PDF)
La métagénomique vise à étudier le contenu génétique et génomique d'un échantillon provenant d'un environnement naturel. Cette discipline récente s'attache à étudier les génomes de différents organismes provenant d'un même milieu. La métagénomique pose de nouvelles questions, tant d'un point de vue biologique qu'informatique. Les masses de données générées par les études métagénomiques et la complexité des milieux étudiés, nécessitent de développer de nouvelles structures de données et de nouveaux algorithmes dédiés. Parmi les différentes approches existantes en métagénomique, la métagénomique comparative consiste à comparer plusieurs métagénomes afin d'en connaître les divers degrés de similarité. Lorsque cette comparaison se base uniquement sur le contenu brut des échantillons, sans faire appel à des connaissances externes, on parle de métagénomique comparative de novo. L'objectif des travaux que nous proposons est de développer une méthode permettant d'extraire les séquences similaires de deux jeux de données métagénomiques, où chaque jeu peut être composé de centaines de millions de courtes séquences. La comparaison proposée consiste à identifier les séquences d'un premier jeu similaires à au moins une séquence d'un second jeu. Afin d'être rapide et économe en mémoire, l'implémentation de notre méthode a nécessité la conception d'une nouvelle structure d'indexation, basée sur le filtre de bloom. Le logiciel final, nommé Compareads, a une consommation mémoire faible (de l'ordre de quelques go) et peut calculer l'intersection de deux échantillons de 100 millions de séquences chacun en une dizaine d'heures. Notre méthode est une heuristique qui génère un faible taux de faux positifs. Le logiciel Compareads est dédié à l'analyse de grands jeux de données métagénomiques. À l'heure actuelle, il est le seul outil capable de comparer de tels jeux. Compareads a été appliqué sur plusieurs projets métagénomiques. Notre outil produit des résultats robustes, biologiquement exploitables et en accord avec diverses méthodes fondamentalement différentes. Il est actuellement utilisé de manière intensive sur les échantillons provenant de l'expédition tara oceans. Sur ce projet, notre méthode à permis de mettre en évidence que les grands systèmes océaniques influent sur la répartition globale des micro-organismes marins.
7

Comparaison de novo de données de séquençage issues de très grands échantillons métagénomiques. Application sur le projet Tara Oceans

Maillet, Nicolas 19 December 2013 (has links) (PDF)
La métagénomique vise à étudier le contenu génétique et génomique d'un échantillon provenant d'un environnement naturel. Cette discipline récente s'attache à étudier les génomes de différents organismes provenant d'un même milieu. La métagénomique pose de nouvelles questions, tant d'un point de vue biologique qu'informatique. Les masses de données générées par les études métagénomiques et la complexité des milieux étudiés nécessitent de développer de nouvelles structures de données et de nouveaux algorithmes dédiés. Parmi les différentes approches existantes en métagénomique, la métagénomique comparative consiste à comparer plusieurs métagénomes afin d'en connaitre les divers degrés de similarité. Lorsque cette comparaison se base uniquement sur le contenu brut des échantillons, sans faire appel à des connaissances externes, on parle de métagénomique comparative de novo. L'objectif des travaux que nous proposons est de développer une méthode permettant d'extraire les séquences similaires entre deux jeux de données métagénomiques, où chaque jeu peut être composé de centaines de millions de courtes séquences d'adn. La comparaison proposée consiste à identifier les séquences d'un premier jeu similaires à au moins une séquence d'un second jeu. Afin d'être rapide et économe en mémoire, l'implémentation de notre méthode a nécessité la conception d'une nouvelle structure d'indexation, basée sur le filtre de bloom. Le logiciel final, nommé Compareads, a une consommation mémoire faible (de l'ordre de quelques go) et peut calculer l'intersection de deux échantillons de 100 millions de séquences chacun en une dizaine d'heures. Notre méthode est une heuristique qui génère un faible taux de faux positifs. Le logiciel Compareads est dédié à l'analyse de grands jeux de données métagénomiques. À l'heure actuelle, il est le seul outil capable de comparer de tels jeux. Compareads a été appliqué sur plusieurs projets métagénomiques. Notre outil produit des résultats robustes, biologiquement exploitables et en accord avec diverses méthodes fondamentalement différentes. Il est actuellement utilisé de manière intensive sur les échantillons provenant de l'expédition tara oceans. Sur ce projet, notre méthode a permis de mettre en évidence que les grands systèmes océaniques influent sur la répartition globale des microorganismes marins.
8

Exploration of microbial diversity and evolution through cultivation independent phylogenomics

Martijn, Joran January 2017 (has links)
Our understanding of microbial evolution is largely dependent on available genomic data of diverse organisms. Yet, genome-sequencing efforts have mostly ignored the diverse uncultivable majority in favor of cultivable and sociologically relevant organisms. In this thesis, I have applied and developed cultivation independent methods to explore microbial diversity and obtain genomic data in an unbiased manner. The obtained genomes were then used to study the evolution of mitochondria, Rickettsiales and Haloarchaea. Metagenomic binning of oceanic samples recovered draft genomes for thirteen novel Alphaproteobacteria-related lineages. Phylogenomics analyses utilizing the improved taxon sample suggested that mitochondria are not related to Rickettsiales but rather evolved from a proteobacterial lineage closely related to all sampled alphaproteobacteria. Single-cell genomics and metagenomics of lake and oceanic samples, respectively, identified previously unobserved Rickettsiales-related lineages. They branched early relative to characterized Rickettsiales and encoded flagellar genes, a feature once thought absent in this order. Flagella are most likely an ancestral feature, and were independently lost during Rickettsiales diversification. In addition, preliminary analyses suggest that ATP/ADP translocase, the marker for energy parasitism, was acquired after the acquisition of type IV secretion systems during the emergence of the Rickettsiales. Further exploration of the oceanic samples yielded the first draft genomes of Marine Group IV archaea, the closest known relatives of the Haloarchaea. The halophilic and generally aerobic Haloarchaea are thought to have evolved from an anaerobic methanogenic ancestor. The MG-IV genomes allowed us to study this enigmatic evolutionary transition. Preliminary ancestral reconstruction analyses suggest a gradual loss of methanogenesis and adaptation to an aerobic lifestyle, respectively. The thesis further presents a new amplicon sequencing method that captures near full-length 16S and 23S rRNA genes of environmental prokaryotes. The method exploits PacBio's long read technology and the frequent proximity of these genes in prokaryotic genomes. Compared to traditional partial 16S amplicon sequencing, our method classifies environmental lineages that are distantly related to reference taxa more confidently. In conclusion, this thesis provides new insights into the origins of mitochondria, Rickettsiales and Haloarchaea and illustrates the power of cultivation independent methods with respect to the study of microbial evolution.

Page generated in 0.0467 seconds