• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 63
  • 39
  • 7
  • Tagged with
  • 86
  • 45
  • 13
  • 13
  • 13
  • 12
  • 12
  • 10
  • 10
  • 10
  • 9
  • 9
  • 8
  • 8
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Study of modularity in molecular, morphological and linguistic evolution using networks methods / Etude de la modularité en évolution moléculaire, morphologique et linguistique par des méthodes de réseaux

Pathmanathan, Jananan 23 October 2017 (has links)
L'évolution moléculaire procède par divergence depuis un ancêtre commun et en combinant des fragments d'objets évoluant d'origines différentes, par des processus introgressifs. Les transferts horizontaux de gènes sont probablement les plus connus de ces processus, mais l'introgression affecte aussi d'autres niveaux d'organisation biologique. Ainsi, la plupart des objets biologiques évoluant peuvent être composés de parties d'origines phylogénétiques différentes et décrits comme composites. Cette évolution modulaire se modélise mal par des arbres, puisque les objets composites ne sont pas seulement le résultat d'une divergence depuis un ancêtre. Les réseaux sont bien plus aptes à modéliser la modularité, et la théorie des graphes peut être utilisée pour chercher dans ces réseaux des patrons caractéristiques d'une évolution réticulée. Pendant cette thèse, j'ai développé le logiciel CompositeSearch qui détecte les gènes composites dans des jeux de données de séquences massifs, jusqu'à plusieurs millions de séquences. Cet algorithme a été utilisé pour identifier et quantifier l'abondance des gènes composites dans des environnements de sols pollués ainsi que dans les plasmides. Les résultats montrent que d'importantes adaptations et nouveautés biologiques découlent de processus œuvrant au niveau subgénique. De plus, les réseaux fournissent un cadre conceptuel dont l'utilité va bien au-delà de l'évolution moléculaire et je les ai appliqués à d'autres objets évoluant, comme les animaux (réseaux de traits morphologiques) et les langues (réseaux de mots). Dans les deux cas, la modularité se révèle être une conséquence évolutive majeure, et obéit à des règles encore à préciser. / Molecular evolution proceeds not only by divergence from a common ancestor, but also by combining parts from evolving objects of different origins, through processes that are called introgressive. Lateral gene transfers are probably the most well-known of these processes, but introgression has been shown to also happen at various levels of biological organization. As a result, most biological evolving objects (genes, genomes, communities) can be composed of parts from different phylogenetic origins and can be described as composites. Such modular evolution is inadequately modeled by trees, since composite objects are not merely the result of divergence from a common ancestor only. Networks on the other hand are much more suited for handling modularity, and graph theory can be used to search networks for patterns that are characteristic of such reticulate evolution. During this PhD, I developed a piece of software, CompositeSearch, that can efficiently detect composite genes in massive sequence dataset, comprising up to millions of sequences. This algorithm was used to identify and quantify the abundance of composite genes in polluted soil environments, and in prokaryotic plasmids. These studies show that important biological novelties and adaptations can result from processes acting at subgenic levels. However, as shown in this manuscript, networks provide a framework that goes well beyond the boundaries of molecular evolution and I have applied them to other evolving entities, such as animals (trait networks) morphology and languages (word networks). In both cases, modularity appears to be a major evolutionary outcome, following rules that remain to be investigated.
22

Caractérisation électrochimique et moléculaire des biofilms électroactifs sur acier inoxydable en milieu marin / Electrochemical and molecular characterization of electroactive biofilms on stainless steel in marine environment

Trigodet, Florian 19 April 2019 (has links)
Les microorganismes sont capables d'augmenter le potentiel libre des aciers inoxydables en eau de mer via un phénomène que l’on appelle anoblissement. Cette élévation de plusieurs centaines de millivolts du potentiel augmente le risque de corrosion localisé. L’anoblissement a été étudié pendant plus de 40 ans, et malgré son importance, les mécanismes microbiens responsables du phénomène n’ont pas été identifiés. Nous avons combiné l’écologie microbienne et l'électrochimie pour étudier la diversité des bactéries associées à l’anoblissement des aciers inoxydables. La température de l’eau de mer ainsi que la teneur en oxygène dissous sont des facteurs qui influencent l’anoblissement et nous les avons utilisés pour identifier la fraction bactérienne associée au changement de potentiel. L’anoblissement est inhibé par une température critique de l’eau de mer (au-dessus de 38°C/40°C) et par une teneur basse en oxygène dissous. A l’aide du séquençage d’amplicons ADN, nous avons identifié des unités taxonomiques opérationnels (OTUs) comme biomarqueurs de l’anoblissement. Certaines étaient affiliées à des bactéries capables de dégrader des hydrocarbures, et une OTU était affiliée à ‘Candidatus Tenderia electrophaga’, une bactérie électrotrophe capable de réduire l'oxygène avec des électrons provenant d’une électrode. Nous avons étudié le rôle de ces bactéries avec des conditions a potentiels fixés et libres avec une approche de métagénomique. Nous avons reconstitué un génome issu d’assemblage métagénomique (MAG) très proche de ‘Candidatus Tenderia electrophaga’ et associé à l'anoblissement. Avec ces résultats, nous avons proposé un nouveau mécanisme bactérien pour expliquer l’anoblissement : les bactéries électrotrophes seraient capables de réduire de l’oxygène avec des électrons provenant du film passif de l’acier inoxydable, et ainsi influencer le potentiel libre et donc l’anoblissement. / Microorganisms increase the opencircuit potential of stainless Steel immersed in seawater in a phenomenon called ennoblement.This change of potential of several hundreds of millivolts raises the chance of localized corrosion.The ennoblement has been studied for more than 40 years, and despite the importance and impact of ennoblement, little is known about the microbial mechanisms responsible for the phenomenon. We have combined microbial ecology and electrochemistry to investigate the diversity of surface attached bacteria associated with stainless steel ennoblement. Seawater temperature and dissolved oxygen content are factors that influence the ennoblement and we used them to infer the bacterial fraction associated with the phenomenon. The ennoblement is inhibited by a critical seawater tempzrature (above 38°C/40°C) and low dissolved oxygen content.With DNA amplicon sequencing, we identified operational taxonomie units (OTUs) that were biomarkers of the ennoblement. There were some OTUs affiliated to hydrocarbon degrading bacteria, and one OTU affiliated to ‘Candidatus Tenderia electrophaga’, an electrotrophic bacteria able to reduce oxygen with electrons from an electrode.We investigated the role of electrotrophic bacteria with potentiostatic and open circuit conditions and with metagenomics we recovered a metagenome assembled genome (MAG) very close to 'Candidatus Tenderia electrophaga’ associated with the ennoblement.From these results, we proposed a new bacterial mechanism to explain the ennoblement : electrotrophic bacteria would be able to reduce oxygen with électron drawn from the stainless steel passivation film, hence influencing the open circuit potential and therefore the ennoblement.
23

Diversité, évolution et écologie virale : des communautés aux génotypes. Analyse bioinformatique de métagénomes viraux

Roux, Simon 03 October 2013 (has links) (PDF)
Les virus sont omniprésents dans la biosphère et infectent vraisemblablement l'ensemble des êtres vivants. Au sein des écosystèmes, ils ont ainsi un impact sur la diversité des populations microbiennes, l'évolution des génomes de ces populations, et directement ou indirectement sur les cycles biogéochimiques majeurs. Leur caractère protéiforme et l'absence de marqueur unique (tant génétique que physique) font toutefois de l'exploration de la diversité virale une tâche complexe, de telle sorte que nos connaissances sur ces communautés virales environnementales sont encore très limitées. La métagénomique, ou séquençage massif et aléatoire de fragments nucléotidiques extraits d'un prélèvement, offre un point de vue unique sur les génomes viraux. Ce type d'approche, récemment développé, a ainsi mis en évidence la richesse extraordinaire des populations virales environnementales, tant du point de vue des gènes que des génotypes. C'est dans ce cadre de l'étude des communautés virales de l'environnement par métagénomique que se sont inscrits les travaux de cette thèse, organisée autour de quatre axes principaux : * Le développement de nouvelles méthodes d'analyses adaptées aux spécificités des génomes et métagénomes viraux par la mise en place du serveur web Metavir, premier serveur dédié à l'analyse des viromes. Proposant aujourd'hui un ensemble cohérent d'outils pour différents types de viromes, Metavir compte plus de 300 utilisateurs pour plus de 2000 viromes analysés. * Le potentiel fonctionnel des génomes viraux a pu être approché par l'étude conjointe d'un ensemble de viromes. Après une analyse rigoureuse des contaminations potentielles, nous avons pu confirmer que les génomes viraux comprenaient un ensemble limité mais non négligeable de gènes associés au métabolisme cellulaire. La plupart des virus agissent ainsi certainement directement sur le métabolisme de la cellule hôte durant l'infection. * La prépondérance des paramètres environnementaux, et particulièrement de la salinité, en tant que facteurs structurant les communautés virales aquatiques a également pu être mise en avant. La distance géographique entre prélèvements semble n'avoir qu'une influence secondaire, confirmant la capacité importante de dispersion des capsides virales. Une adaptation locale semble toutefois exister dans certains cas, notamment en cas de compétition importante entre les résistances développées par les hôtes et les capacités d'infection des virus. * Enfin, différentes familles de petits virus à ADN simple brin ont pu être caractérisées par une méta-analyse de viromes. Leur apparente simplicité a ainsi révélé des mécanismes d'évolution plus complexes que prévus, impliquant différents cycles et capacités de transfert de gènes jusqu'ici plutôt considérés comme l'apanage des virus à ADN double brin, et remettant en cause les séparations admises entre les différents groupes de virus sur la base de la nature de leur génome. En permettant une étude depuis l'échelle de la communauté jusqu'à des génotypes spécifiques, les viromes constituent des outils de choix pour caractériser la diversité virale, appréhender les différents facteurs régulant ces communautés, et ainsi mieux comprendre la place des virus dans la biosphère. De plus, ces études ont confirmé l'existence d'interactions étroites entre virus et organismes cellulaires, ces interactions semblant nombreuses, multiples dans leurs natures et conséquences, et présentes tout au long de l'histoire du vivant. Ces nouvelles connaissances apportées par l'analyse de viromes permettent donc d'aborder certaines questions fondamentales concernant l'origine des grandes innovations évolutives ou le fonctionnement global des écosystèmes.
24

Développement expérimental et application sur terrain d'outils innovants pour l'identification des arthropodes / Experimental development and field application of innovative tools for arthropods identification

Nebbak, Amira 23 November 2017 (has links)
Les arthropodes hématophages tels que les moustiques, les tiques et les puces ont une importance significative en santé publique en raison de leur capacité à transmettre des maladies majeures aux humains et aux animaux. La lutte anti-vectorielle et la surveillance épidémiologique des vecteurs sont essentielles dans la stratégie de lutte contre ces maladies. Cette dernière n'est réussie que grâce à une identification correcte et précise des vecteurs. Ainsi dans ce travail nous avons mis au point les protocoles pour la préparation des échantillons pour l'identification des moustiques adultes et leur stades aquatiques ainsi que des tiques et des puces par MALDI-TOF MS. Cet outil s'est déjà distingué comme étant fiable pour l'identification des arthropodes. La deuxième partie de notre travail a consisté en l'application de ces protocoles sur des larves de moustiques collectées sur terrain durant une enquête entomologique menée dans la ville de Marseille. Lors de cette étude, la pertinence et la fiabilité du MALDI-TOF MS pour l'identification des larves de moustiques collectées sur terrain a été vérifiée. Enfin, nous avons réalisé l'inventaire des communautés virales de trois espèces de moustiques collectées à Marseille par métagénomique, qui a révélé la présence de nombreux nouveaux virus. L'ensemble des résultats présentés dans cette thèse souligne que l'utilisation d'outils innovants tels que le MALDI-TOF MS et la métagénomique pour étudier les vecteurs et les agents qu'ils portent est une stratégie prometteuse qui contribuera dans la connaissance des cycles de transmission zoonotique et des risques potentiels d'émergence des maladies vectorielles en population humaine. / Hematophagous arthropods such as mosquitoes, ticks, and fleas are of significant importance in public health because of their ability to transmit major diseases to humans and animals. Vector control and epidemiological vector surveillance are essential in the strategy of combating vector-borne diseases. The latter is successful only by a correct and precise identification of the vectors. Thus in this work, we have developed and improved the protocols of samples preparation for the identification of adult mosquitoes and their aquatic stages, ticks, and fleas by MALDI-TOF MS. This tool has been already distinguished as being reliable for the arthropods identification. The second part of our work consisted in the application of these protocols on mosquito larvae collected in the field during an entomological investigation carried out in the city of Marseille. In this study, the relevance and reliability of MALDI-TOF MS for the identification of mosquito larvae collected in the field were verified. Finally, we carried out the inventory of the viral communities of three mosquito species collected in Marseille by metagenomics, which revealed the presence of numerous new viruses. All the results presented in this thesis emphasize that the use of innovative tools such as MALDI-TOF MS and metagenomics to study vectors and the agents they carry is a promising strategy that will contribute to the knowledge of zoonotic transmission cycles and the potential risks of the emergence of vector-borne diseases in human populations.
25

Épidémiologie moléculaire des géminivirus responsables de maladies émergentes sur les cultures maraîchères au Burkina Faso et en Côte d'Ivoire / Molecular epidemiology of geminiviruses responsible for emerging diseases on vegetable crops in Burkina Faso and Ivory Coast

Ouattara, Alassane 12 December 2017 (has links)
Les épidémies virales constituent une menace majeure pour les cultures dans de nombreuses régions tropicales et subtropicales du monde. En Afrique de l'Ouest et Centrale, malgré la caractérisation d'une multitude de nouvelles espèces de géminivirus, les connaissances sur l'épidémiologie des maladies virales émergentes restent incomplètes, notamment concernant la diversité et l'identification précise des espèces virales incriminées. Paradoxalement, si l'on considère que la plupart des maladies émergentes causées par les géminivirus sont liées à des virus infectant naturellement les plantes sauvages, et qui se seraient adaptés aux plantes cultivées introduites, la diversité des populations virales dans leurs écosystèmes naturels reste très largement méconnue. De plus, le caractère non pérenne de la majorité des plantes maraîchères suggère l'existence de plantes hôtes alternatives ou réservoirs, qui permettent aux populations virales de se maintenir lors des périodes d'intercultures. Par conséquent, pour lutter contre ces nouvelles maladies virales dévastatrices, il est primordial d'acquérir de meilleures connaissances de la diversité des populations virales des plantes cultivées et sauvages, de leurs répartitions géographiques, de leurs liens phylogénétiques, de leurs pathogénicités et des principaux facteurs épidémiologiques à ''échelle des agro-écosystèmes. Ainsi, les travaux entrepris dans cette thèse ont porté sur l'analyse d’échantillons de plantes maraichères et non cultivées provenant de 48 localités réparties sur le territoire du Burkina Faso et de Côte d'Ivoire. Nos principaux résultats confirment à la fois la non-exhaustivité de notre connaissance de la diversité des géminivirus présent sur les cultures maraîchères, avec l'existence d’au moins cinq espèces de géminivirus impliqués dans la maladie du ToLCD-TYLCD, d'un gradient Nord-Sud de complexité des espèces de géminivirus au Burkina Faso, la prédominance du PepYVMLV sur les solanées cultivées et la présence de nombreuses plantes alternatives ou réservoirs. Au regard de la découverte d'un nouveau composant d'ADN-B en association avec le PepYVMLV, les principaux paramètres du pouvoir pathogène du PepYVMLV en infection simple ou mixte avec le composant d'ADN-B ont été évalués en conditions contrôlées. Nos résultats démontrent que même si le PepYVMLV n'est pas un bégomovirus bipartite strict, l'ADN-B représente à la fois un activateur fort de la virulence, de l'accumulation du virus dans la plante et de la transmission par son insecte vecteur Bemisia tabaci, qui semblent concourir à sa prédominance sur le terrain. Une diffusion plus large de ce composant d'ADN-B représenterait une menace majeure pour la culture de la tomate au Burkina Faso, en Afrique et plus largement dans le monde. L'élargissement des analyses par l'utilisation d'une approche métagénomique à non seulement permis de confirmer la présence d'une majorité des virus décrits préalablement avec les approches classiques, mais également la caractérisation de nouvelles espèces virales. L'analyse des réseaux d'associations virus-plantes hôtes et virus-virus ont montré des liens forts entre les populations virales associés à des groupes de genres de plantes cultivées et non cultivées soulignant la nécessité de considérer les agro-écosystèmes dans leur totalité pour lutter contre les maladies à géminivirus. L'ensemble de nos résultats soulignent l'importance des travaux d'épidémiosurveillance et d'inventaire des populations virales sur les plantes cultivées et sauvages afin de comprendre le fonctionnement des communautés virales à l'échelle des agroécosystèmes et l'impact des perturbations anthropiques sur les processus d’émergence de nouvelles maladies. / Geminiviruses have emerged to become one of the largest and most economically important groups of plant-infecting viruses, and geminivirus-induced diseases are a major threat to worldwide vegetable production, particularly in tropical and subtropical regions of the world. Importantly, the accumulated body of work on some of the most important geminiviral associated diseases clearly demonstrate the role of geminiviruses associated with wild plants on the emergence of disease on imported crops. Moreover, recent metagenomic data suggested that the vast majority of viruses characterized from crops represent only a small fraction of the phytoviruses in general. It is therefore of prime interest to obtain a better knowledge of viral diversity infecting crops and wild plants, the main epidemiological parameters involved in their emergence and their dynamic at the scale of agro-ecological systems. In this work, a survey of solanaceous crop fields and their surrounding uncultivated plants from 48 localities in Burkina Faso and Ivory Coast was performed. The sample analysis using classical molecular biology tools both confirm the incompleteness of our knowledge of the geminivial diversity and the existence of numerous alternative wild host plants. At least five species of begomovirus and mastrevirus were found in association with the ToLCD-TYLCD. A North to South increasing gradient of complexity of viruses populations was uncover with PepYVMLV being the most prevalent on cultivated solanaceous plants. The discovery of the association of a newly described DNA-B component with the PepYVMLV also lead to the study of the epidemiological parameters of this co-infection. Despite this association being relaxed, it was demonstrated that the virulence of the disease, the viral accumulation and the transmission by Bemisia tabaci were increased with the presence of the co-infection with the DNA-B component. All these factors are probably associated with the success of this association on the field. Because of the extreme severity of the resulting disease, the diffusion of this new DNA-B component at a larger scale would represent a major threat to tomato culture in Burkina Faso, Africa and the world in general. The use of a metagenomic approach, allow the generalization of our findings to full agro-ecological settings. Besides confirming previous species discovery, species yet undescribed in Burkina Faso along with completely new begomovirus species were described. The inspection of the virus-plant and virus-virus associations networks allow to uncover strong links existing between the viral corteges associated to groups of cultivated and uncultivated plants. These findings emphasized the necessity to consider full agro-ecological settings plant diversity rather than only crops in order to understand and prevent geminiviruses associated diseases. Globally, our results highlight the necessity to carry on the ongoing plant disease monitoring work and the inventory of viral populations associated with cultivated and uncultivated plants in order to understand the functioning of natural geminiviral community and the impact of human practices on the emergence of viral disease.
26

Développement et utilisation d'outils bioinformatiques appliqués à la métagénomique / Design and application of bioinformatic tools for metagenomics

Verneau, Jonathan 24 November 2017 (has links)
Les virus sont ubiquitaires et abondants dans l’environnement. Ils influent fondamentalement sur l’écologie de l’ensemble des écosystèmes et du microbiote humain. Dès 2002, avec la découverte de virus géants d’amibes, la virologie s’est complexifiée. Les Megavirales (nouvel ordre au sein des grands virus nucléocytoplasmiques) ont 10% de gènes homologues aux cellules eucaryotes, et ont la caractéristique singulière d’être infectés par des virophages.Avec l’avènement de la métagénomique, le nombre de métagénomes produits ne cesse de croître de manière exponentielle. C’est ainsi que la virologie a connu un nouvel essor et a pu mieux être étudiée en s’affranchissant des difficultés de culture et d’isolement des virus dans les conditions artificielles de laboratoire. La métagénomique permet d’étudier les communautés microbiennes mais également de découvrir de nouveaux microbes. La bioinformatique est devenue incontournable dans le domaine de la biologie et essentielle pour les biologistes afin de traiter les masses de données et en extraire toute la richesse de l’information biologique nécessaire. La première partie de cette thèse consiste en une revue de la littérature décrivant la bioinformatique au service de la métagénomique virale. La deuxième partie présente la création d’un nouvel outil « MG-Digger » dédié à l’analyse rapide et automatisée de séquences d’intérêts spécifiques dans les métagénomes. La dernière partie se concentre sur l’utilisation de cet outil sur des données issues de projets métagénomiques afin de répondre à des questions biologiques précises, notamment sur les données de l’expédition scientifique TARA à travers les océans. / Viruses are ubiquitous and abundant in the environment and can influence all ecosystems ecology and the human microbiota.Since 2002, with the discovery of giant viruses of amoeba, virology has become more complex and the definition of virus has been called into question, not only because of their phenotypic sizes similar to those of bacteria but also their genomic content exceeding thousand genes. Megavirales, also known as nucleocytoplasmic large DNA viruses, have 10% homologous genes to eukaryotic cells and interestingly can be infected by virophages. With the advent of metagenomic, the number of metagenomes produced is exponentially increasing as well as our understanding of virology which has been studied. Metagenomics studies showed an efficient way to study microbial communities and identify novel viruses without the difficulties of culture and isolation of viruses in artificial laboratory conditions.Metagenomic requires considerable computational and storage resources (Big data processing). Therefore, bioinformatics has become an integral part of research and development in the biomedical sciences by providing tools that handle complex datasets and finally giving the necessary biological information. The first part of this thesis consists of an exhaustive review of the literature describing bioinformatics and viral metagenomics. The second part presents a new "MG-Digger" tool dedicated to the rapid and automated analysis of specific interest sequences in metagenomes. The third part focuses on the use of this tool on metagenomic data to answer to specific biological questions, including data from the TARA scientific expedition across the oceans.
27

Solutions d'amélioration des études de métagénomique ciblée / Solutions to improve targeted metagenomics studies

Siegwald, Léa 23 March 2017 (has links)
La métagénomique ciblée, étude de la composition et de la diversité des communautés microbiennes présentes dans différents échantillon biologiques sur la base d'un marqueur génomique, a connu un véritable essor lors de cette dernière décennie grâce à l'arrivée du séquençage haut-débit. Faisant appel à des outils de biologie moléculaire et de bioinformatique, elle a été à l’origine de substantiels progrès dans les domaines de l’évolution et de la diversité microbienne. Cependant, de nouvelles problématiques sont apparues avec le séquençage haut-débit : la génération exponentielle de données soulève des problèmes d'analyse bioinformatique, qui doit être adaptée aux plans d'expérience et aux questions biologiques associées. Cette thèse propose des solutions d'amélioration des études de métagénomique ciblée par le développement d'outils et de méthodes innovantes, apportant une meilleure compréhension des biais d'analyse inhérents à de telles études, et une meilleure conception des plans d'expérience. Tout d'abord, une expertise du pipeline d'analyse utilisé en production sur la plate-forme PEGASE-biosciences a été menée. Cette évaluation a révélé la nécessité de mettre en place une méthode d'évaluation formelle de pipelines d'analyses de données de métagénomique ciblée, qui a été développée sur la base de données simulées et réelles, et de métriques d'évaluation adaptées. Cette méthode a été utilisée sur plusieurs pipelines d'analyse couramment utilisés par la communauté, tout comme sur de nouvelles approches d'analyse jamais utilisées dans un tel contexte. Cette évaluation a permis de mieux comprendre les biais du plan d'expérience qui peuvent affecter les résultats et les conclusions biologiques associées. Un de ces biais majeurs est le choix des amorces d'amplification de la cible ; un logiciel de design d'amorces adaptées au plan d'expérience a été spécifiquement développé pour minimiser ce biais. Enfin, des recommandations de montage de plan d'expérience et d'analyse ont été émises afin d'améliorer la robustesse des études de métagénomique ciblée. / Targeted metagenomics is the study of the composition of microbial communities in diverse biological samples, based on the sequencing of a genomic locus. This application has boomed over the last decade thanks to the democratisation of high-throughput sequencing, and has allowed substantial progress in the study of microbial evolution and diversity. However, new problems have emerged with high-throughput sequencing : the exponential generation of data must be properly analyzed with bioinformatics tools fitted to the experimental designs and associated biological questions. This dissertation provides solutions to improve targeted metagenomics studies, by the development of new tools and methods allowing a better understanding of analytical biases, and a better design of experiments. Firstly, an expert assessment of the analytical pipeline used on the PEGASE-biosciences plateform has been performed. This assessment revealed the need of a formal evaluation method of analytical pipelines used for targeted metagenomics analyses. This method has been developed with simulated and real datasets, and adequate evaluation metrics. It has been used on several analytical pipelines commonly used by the scientific community, as well as on new analytical methods which have never been used in such a context before. This evaluation allowed to better understand experimental design biases, which can affect the results and biological conclusions. One of those major biases is the design of amplification primers to target the genomic locus of interest. A primer design software, adaptable to different experimental designs, has been specifically developed to minimize this bias. Finally, analytical guidelines and experimental design recommendations have been formulated to improve targeted metagenomics studies.
28

Diversité et écologie des virus associés aux arthropodes : des communautés aux génomes / Diversity and ecology of arthropod associated viruses : from communities to genomes

François, Sarah 28 November 2017 (has links)
Les nouvelles technologies de séquençage des génomes ont permis de révéler l’extraordinaire diversité des séquences virales dans des groupes d’hôtes jusque-là largement inexplorés. Ainsi, notre connaissance des virus d’arthropodes, infectant les animaux les plus diversifiés et abondants sur Terre, était jusque-là essentiellement réduite à des espèces d’intérêt économique et médical. Les nouvelles données de diversité virale chez les arthropodes illustrent le besoin d’étendre l’inventaire viral à l’échelle de l’écosystème et d’inclure les virus comme une composante essentielle de leur fonctionnement et de leur évolution.Dans ces travaux de thèse, j’ai développé et appliqué deux approches d’étude de la diversité virale chez des arthropodes, ainsi que de la circulation des virus dans des écosystèmes, en me focalisant sur des espèces d’intérêt agronomique : i) une approche virus-centrée par fouille de bases de données nucléotidiques, en recherchant la présence d’un groupe de petits virus à ADN inféodés aux arthropodes, les densovirus ii) une approche arthropode-centrée, utilisant une méthode séquençage haut débit de génomes viraux (métagénomique virale) pour analyser des communautés virales associées à des arthropodes de différents niveaux trophiques échantillonnés dans des agroécosystèmes.Mes résultats ont permis de :(i) Mettre en évidence que les densovirus sont largement présents dans l’ensemble du règne animal - notamment chez une grande diversité d’arthropodes - et qu’ils sont très diversifiés génétiquement, ce qui a permis de mieux appréhender histoire évolutive de ce groupe de virus ;(ii) Découvrir de nouveaux virus chez certains ravageurs de cultures : le tétranyque tisserand (Tetranychus urticae, Acarien) provenant de populations de laboratoires, ainsi que le puceron vert du pois (Acyrthosiphon pisum, Hémiptère), le phytonome de la luzerne (Hypera postica, Coléoptère) et l’armigère de la tomate (Helicoverpa armigera, Lépidoptère) provenant de populations naturelles échantillonnées dans des cultures de luzerne et des prairies. Ces études ont permis de mettre en évidence la présence de viromes spécifiques de chaque espèce d’arthropode et de caractériser la distribution de certains virus dans des communautés d’arthropodes d’un même écosystème. Plus de 60 nouvelles espèces de virus d’arthropodes et de plantes ont été découvertes. Leurs liens évolutifs avec des espèces de virus connues ont été caractérisés par des analyses phylogénétiques.(iii) Enfin, les travaux menés en (ii) ont également permis d’optimiser la méthodologie permettant d’obtenir et d’analyser des viromes obtenus à partir d’échantillons multiplexés, optimisant notamment l’étape d’attribution taxonomique des séquences obtenues par séquençage à haut débit, réduisant ainsi leur proportion en « matière noire » inhérente aux analyses des viromes. / High throughput sequencing technologies have revealed the extraordinary diversity of viral sequences in hitherto largely unexplored host groups. Thus, our knowledge about arthropod viruses, infecting the most diverse and abundant animals on Earth, was hitherto essentially reduced to species of economical and medical interest. New data on viral diversity in arthropods illustrate the need to expand viral inventory at the scale of the ecosystem and to include viruses as an essential component of their functioning and their evolution.In my thesis, I developed and applied two approaches to study the diversity of viruses in arthropods and how virus circulate in ecosystems, focusing on species of agronomic interest: (i) a virus-centered approach by exploring nucleotidic sequence databases, searching for the presence of a group of small DNA viruses infecting arthropods, the densoviruses (ii) an arthropod-centered approach at the scale of the ecosystem, using a viral metagenomic method to analyze viral communities associated with arthropods from different trophic levels from the same agroecosystems.My results showed that:(i) Densoviruses are spread throughout the animal kingdom - particularly in a wide diversity of arthropods - and are highly diverse genetically, which led to a better understanding of the evolutionary history of this group of viruses;(ii) A number of new viruses can be described in pests: the spider mite (Tetranychus urticae, Acari) from laboratory populations, as well as the green pea aphid (Acyrthosiphon pisum, Hemiptera), the alfalfa weevil (Hypera postica, Coleoptera) and the cotton bollworm (Helicoverpa armigera, Lepidoptera) from natural populations sampled from alfalfa crops and grasslands. These studies also highlighted that specific viromes are associated with each pest species, and I characterized the distribution of some of these viruses in arthropod communities. In total, more than 60 new species of arthropod and plant viruses were discovered. Their evolutionary links with known virus species was characterized by phylogenetic analyzes.(iii) The work realized in (ii) also contributed to optimize a methodology to prepare and analyze viromes from multiplexed samples, that is particularly suitable to optimize the taxonomic allocation of sequences and thus reduce the "dark matter" that is inherent to viral metagenomics analyses.
29

Etude génomique et métagénomique de la diversité génétique, la distribution écologique et l'évolution des picocyanobactéries marines / Genomic and metagenomic study of the genetic diversity, ecological distribution and evolution of marine picocyanobacteria

Farrant, Gregory 27 April 2015 (has links)
Les picocyanobactéries marines des genres Prochlorococcus et Synechococcus sont les organismes photosynthétiques les plus abondants de la planète et ils contribuent de façon substantielle à la production primaire mondiale. Alors que le genre Prochlorococcus se caractérise par sa forte abondance dans les régions oligotrophes et son génome réduit, le genre Synechococcus se distingue par sa grande diversité génétique et pigmentaire ainsi qu'une aire de distribution plus étendue.Le principal objectif de ce travail a été de mettre en relation la diversité génétique de ces organismes avec leur niche écologique par des approches de génomique comparative et de métagénomique. Tout d'abord, le développement d'une méthode de scaffolding (WiseScaffolder) a permis de clore 32 nouveaux génomes de Synechococcus, lesquels ont été intégrés au système d'information Cyanorak, dédié à l'annotation de gènes orthologues. Ces nouveaux génomes, complétant les 65 génomes disponibles pour ces deux genres, ont fait l'objet d'analyses comparatives afin de mieux comprendre la diversité et l'évolution de ce phylum et de définir les gènes spécifiques de différents groupes phylogénétiques, potentiellement liés à leur adaptation à des niches écologiques distinctes.Ces génomes ont ensuite été utilisés comme référence, en conjonction avec le gène marqueur petB, pour analyser les données de métagénomique issues de l'expédition TARA-Océans. Ces analyses ont notamment mis en lumière la diversité génétique, la distribution et l'importance écologique de certains clades phylogénétiques. Ce travail soulève de nouvelles hypothèses quant au rôle des picocyanobactéries dans le fonctionnement global des océans. / Marine picocyanobacteria Prochlorococcus and Synechococcus genera are the most abundant photosynthetic organisms and contribute substantially to global primary production. While the genus Prochlorococcus is characterized by its high abundance in oligotrophic regions and its reduced genome, Synechococcus is characterized by a larger genetic and pigment diversity and a wider area of distribution.The main objective of this PhD thesis was to link the genetic diversity of these organisms to the environmental conditions of their ecological niche by comparative genomics and metagenomics approaches. Firstly, the development of a scaffolding method (WiseScaffolder) has allowed us to close 32 new genomes of Synechococcus which were integrated into the Cyanorak information system dedicated to the annotation of orthologous genes. These new genomes, supplementing the 65 genomes previously available for these two genera, allowed us to perform comparative analyses which led to a better understanding of the diversity and evolution of this phylum and to the definition of genes sets specific to different phylogenetic groups and thus potentially related to their adaptation to different ecological niches.These genomes were then used as reference, in conjunction with the marker gene petB gene, to analyze metagenomic data produced in the frame of the Tara-Oceans Expedition. In particular, these analyzes highlighted the genetic diversity, distribution and ecological importance of some phylogenetic clades. This work raises new hypotheses about the role of picocyanobacteria in the overall functioning of the oceans.
30

Comparaison de novo de données de séquençage issues de très grands échantillons métagénomiques : application sur le projet Tara Oceans / De novo comparision of huge metagenomic experiments coming from NGS technologies : application on Tara Oceans project

Maillet, Nicolas 19 December 2013 (has links)
La métagénomique vise à étudier le contenu génétique et génomique d'un échantillon provenant d'un environnement naturel. Cette discipline récente s'attache à étudier les génomes de différents organismes provenant d'un même milieu. La métagénomique pose de nouvelles questions, tant d'un point de vue biologique qu'informatique. Les masses de données générées par les études métagénomiques et la complexité des milieux étudiés, nécessitent de développer de nouvelles structures de données et de nouveaux algorithmes dédiés. Parmi les différentes approches existantes en métagénomique, la métagénomique comparative consiste à comparer plusieurs métagénomes afin d'en connaître les divers degrés de similarité. Lorsque cette comparaison se base uniquement sur le contenu brut des échantillons, sans faire appel à des connaissances externes, on parle de métagénomique comparative de novo. L'objectif des travaux que nous proposons est de développer une méthode permettant d'extraire les séquences similaires de deux jeux de données métagénomiques, où chaque jeu peut être composé de centaines de millions de courtes séquences. La comparaison proposée consiste à identifier les séquences d'un premier jeu similaires à au moins une séquence d'un second jeu. Afin d'être rapide et économe en mémoire, l'implémentation de notre méthode a nécessité la conception d'une nouvelle structure d'indexation, basée sur le filtre de bloom. Le logiciel final, nommé Compareads, a une consommation mémoire faible (de l'ordre de quelques go) et peut calculer l'intersection de deux échantillons de 100 millions de séquences chacun en une dizaine d'heures. Notre méthode est une heuristique qui génère un faible taux de faux positifs. Le logiciel Compareads est dédié à l'analyse de grands jeux de données métagénomiques. À l'heure actuelle, il est le seul outil capable de comparer de tels jeux. Compareads a été appliqué sur plusieurs projets métagénomiques. Notre outil produit des résultats robustes, biologiquement exploitables et en accord avec diverses méthodes fondamentalement différentes. Il est actuellement utilisé de manière intensive sur les échantillons provenant de l'expédition tara oceans. Sur ce projet, notre méthode à permis de mettre en évidence que les grands systèmes océaniques influent sur la répartition globale des micro-organismes marins. / Metagenomics studies overall genomic information of multiple organisms coming from the same biotope. The information is generally provided by next generation sequencing technologies (NGS). Typical data are samples of short reads (i.e. reads of few hundred base pairs). To study such metagenomics information, we developed an original method for extracting similarities between two samples of reads. More precisely, this approach locates the set of common reads present in two samples. In order to fit with current memory capacities and to be time efficient, we used a modified Bloom filter data structure. Finding the common reads between multiple samples and crossing this information with the location of samples leads to visualize some biological processes like ubiquitous species or effect of water stream caring some species. Finally, the tool can also be used as a filter on metagenomics datas to remove for example only one specie. Our software, Compareads, is actually used on the Tara Oceans project where it shows that global dynamic of oceans seems to play a part on the dispersion of marine microorganisms.

Page generated in 0.0511 seconds