Global ETD Search

1	Graph models and algorithms in (co-)evolutionary contexts / Algorithmes et modélisation en graphes dans des contextes de (co-)évolution Donati, Beatrice 12 November 2014 (has links) Cette thèse s'inscrit dans le cadre de la bioinformatique. Les outils mathématiques les plus utilisés dans ce travail relèvent de la théorie des graphes, des statistiques, de la théorie des ensembles et des mathématiques discrètes. Ces mathématiques ont permis de développer des modèles de systèmes biologiques ainsi que des algorithmes efficaces dans l'étude concrète de ces modèles. La nécessité d'analyses de jeux de données de très grande taille a rendu critique dans notre démarche cette notion d'efficacité des algorithmes. Il faut enfin remarquer que le champ biologique qui a servi de support à cette thèse nous a conduit à explorer un domaine particulier au sein de la théorie de la complexité, à savoir le développement et l'analyse des algorithmes d'énumération [etc...] / In the results presented in the present manuscripts, graph theory and combinatorial optimizationtecniques, have been used to model and solve biological problems. The manuscript is divided in twoparts, each one containing the mathematical and biological background of a given application and ouroriginal contributions to it.Part I groups a set of results designed for phylogenetics analysis, and in particular for reconstructingthe co-evolution of two groups of organisms (the so called co-phylogeny reconstruction problem).Although the addressed problem was treated in the available there was no method that solved suchproblem in a complete and efficient way. We thus developed and implemented a new one, calledEucalypt, with this purpose in mind. This not only provides a novel and usable software for cophylogenyreconstruction but also allows to investigate how the event-based model performs inpractice in terms of thenumber and quality of the solutions obtained. We compared our method to the available software. Bylooking at the results obtained, some interesting considerations about the advantages anddisadvantages of the commonly accepted mathematical model could be drawn. Finally, we introduceda new version of the problem where the host-switches are distance bounded: the k-bounded-All-MPRproblem. Eucalypt solves both problems in polynomial delay. These results have been accepted forpublication by the jounal Algorithms for Molecular Biology. The relative software is publicyavailable.Our studies show that the 'most parsimonious scenario' approach presents some limitationsthat cannot be ignored. To deal with these problems, we developed a second algorithm, called Coala,based on an approximate Bayesian computation approach for estimating the frequency of the events.The benefits of this method are twofold: it provides more confidence in the set of costs to be used in areconciliation, and it allows to estimate the frequency of the events in the cases where a reconciliationmethod cannot be applied. These results are currently under review by the jounal Systematic Biology.The relative software is publicy available.In Part 2 another set of studies is presented. Our original model for the contig scaffolding problem,and our algorithm MeDuSa, are presented and tested. Unlike traditional software, it does not rely eitheron paired-end information of sequencing reads or on a phylogenetic distance of the microorganismsused in the analysis. This drastically increases the usability of our software and, at the same time,reduces the computational time required for genome scaffolding. We show that the algorithmimplemented in MeDuSa, in most cases, is capable of producing less and longer scaffolds incomparison to commonly used scaffolders, while maintaining high accuracy and correctness of thepredicted joins. These results are currently under revision by the journal Bioinformatics.Finally, during the development of this method we encountered some pure theoretical open problemsand we decided to dedicate part of our job to their analysis. The last chapter is then dedicated to a setof problems, all related to the Implicit Hitting set enumeration problem. After some formal definitions,an original NP-completeness result is presented and the future directions of our work are described Analyses phylogénétiques Graphiques Scaffolding Phylogenetic analyses Graph 570.15
2	Analyse de l’épissage alternatif dans les données RNAseq : développement et comparaison d’outils bioinformatiques / Analysis of alternative splicing in RNA-Seq data : development and comparison of bioinformatics tools Benoit-Pilven, Clara 15 December 2016 (has links) L'épissage alternatif est un processus biologique qui génère la diversité du protéome malgré le nombre limité de gène. Ce mécanisme régule à la fois les gènes de manières qualitatives (isoformes exprimées) mais aussi quantitatives (niveau d'expression). Avec le développement des technologies de séquençage à haut débit, il est maintenant possible d'étudier à large échelle les aspects quantitatif et qualitatif du transcriptome avec une même expérience (RNA-seq). Durant ma thèse, j'ai développé une nouvelle méthode d'analyse de l'épissage alternatif dans les données RNA-seq. J'ai également participé à la mise en place du pipeline global d'analyse de données RNA-seq (expression et épissage) qui a été utilisé pour analyser un grand nombre de jeux de données. Dans un second temps, nous avons comparé notre outil d'analyse de l'épissage, FaRLine, qui est basé sur l'alignement sur un génome de référence, à KisSplice, une méthode basée sur l'assemblage. Nous avons montré que ces méthodes trouvaient un grand nombre d'événements en communs (70%), mais qu'il existait des différences non négligeables dues à la méthodologie. Nous avons analysé et classifié ces événements en 4 grandes catégories. Les variants faiblement exprimés et les exons chevauchant des éléments répétés sont mieux annotés par les méthodes basées sur l'alignement. Alors que les méthodes basées sur l'assemblage trouvent des nouveaux variants (exons ou sites d'épissage non annotés) et prédisent de l'épissage alternatif dans les famille de gènes paralogues. Notre travail souligne les points qui nécessitent encore l'amélioration des méthodes bioinformatiques. Enfin, j'ai participé au développement de méthodes permettant d'aider les biologistes à évaluer l'impact fonctionnel de modification d'épissage, que ce soit au niveau de la protéine produite (annotation des domaines protéiques au niveau des exons), ou à un niveau plus global en intégrant les modifications d'épissage dans les voies de signalisation / Alternative splicing is the biological process that explain the large diversity of the proteome compared to the limited number of genes. This process allow a qualitative regulation (expressed isoforms) and a quantitative regulation (expression level). The growth of high-trhoughtput sequencing methods enabled the analysis of these two aspects (quantitative and qualitative regulation) with the same experiment (RNA-Seq). During my PhD, I developped a new tool to analyse alternative splicing from RNA-Seq data. I also participated in the automatisation of the complet pipeline of RNA-Seq analysis (expression and splicing). This pipeline has been used to analyse various datasets. Then, we compared our mapping-first tool, FaRLine, with an assembly-first method, KisSplice. We found that the predictions of the two pipelines overlapped (70\% of exon skipping events were common), but with noticeable differences. The mapping-first approach allowed to find more lowly expressed splicing variants, and was better in predicting exons overlapping repeated elements. The assembly-first approach allowed to find more novel variants, including novel unannotated exons and splice sites. It also predicted AS in families of paralog genes. Our work point out where the bioinformatic improvment are still needed. Finally, I participated in the developpement of bioinformatics methods to help biologists to evualuate the fonctionnal impact of splicing alteration : at the level of the protein product by annotating fonctionnal domain at the exon level or at a more global level, by integrating splicing modifications in signaling pathways Epissage alternatif Transcriptome Bioinformatique Alternative splicing Transcriptome Bioinformatic 570.15
3	Solvants et sites de liaison hydrophobes / Solvents and hydrophobic binding sites Senac, Caroline 28 February 2018 (has links) La plupart des sites de liaisons des cibles thérapeutiques sont hydrophobes. La majorité des molécules actives sont donc hydrophobes et difficilement soluble dans l'eau. Pour remédier à ce problème lors des test in vitro, un cosolvant est ajouté dans le milieu de réaction pour augmenter la solubilité des molécules. Le plus commun est le diméthylsulfoxyde (DMSO). Cependant, peu d'études ont regardé l'effet du DMSO sur l'affinité des ligand hydrophobes pour leurs cibles, mais toutes ont montré une modification de l'affinité induite par le DMSO. Pour mieux comprendre l'effet du DMSO il est nécessaire d'étudier un grand nombres de système ligand/récepteur différents. Dans cette étude, nous avons étudié l'effet d'une concentration de 5% de DMSO sur la liaison d'un ligand hydrophobe l'acide adamantane-1-carboxylique (ADA) dans deux cavités hydrophobes la beta et la gamma cyclodextrines (CD). Les deux CD diffèrent par la largeur de leur cavité. Les mesures d'affinités ont été réalisées par mesure de vélocité ultrasonore, résonance magnétique nucléaire et par des simulations moléculaires (MS). Toutes les techniques ont montré que le DMSO n'a pas d'effet sur l'affinité de l'ADA pour la gamma-CD alors qu'il diminue fortement l'affinité de l'ADA pour la beta-CD. L'analyse des MS a montré que le DMSO entre en compétition avec l'ADA pour la petite cavité de la beta-CD alors que pour la large cavité de la gamma-CD cette compétition n'est pas présente. L'effet du DMSO semble plus important lorsque le volume du ligand est parfaitement adapté au volume de la cible. / Most therapeutic targets are proteins whose binding sites are hydrophobic cavities. For this reason, the majority of drugs under development are hydrophobic molecules exhibiting low solubility in water. To tackle this issue, a few percent of cosolvent, such as dimethyl sulfoxide (DMSO), is usually employed to increase drug solubility during the drug screening process. However, the few published studies dealing with the effect of adding DMSO showed that the affinity of hydrophobic ligands is systematically underestimated. To better understand the effect of DMSO, there is a need of studying its effect on a large range of systems. In this work, we used beta and gamma-cyclodextrins (CD) as models of hydrophobic cavities to investigate the effect of the addition 5% DMSO on the affinity of 1-adamantane carboxylic acid (ADA) to these CD. The two systems differ by the size of the CD cavity. The evaluation of binding constants was performed using ultrasound velocimetry, nuclear magnetic resonance spectroscopy, and molecular simulations (MS). All techniques show that the presence of 5% DMSO does not significantly modify the affinity of ADA for gamma-CD, while the affinity is dramatically reduced for beta-CD. MS analysis show a competition between DMSO and ADA for the small cavity of beta-CD, which is not present for the large cavity of gamma-CD. The bias induced by the presence of DMSO is thus more important when the ligand volume better fits the CD cavity. Solvant Cyclodextrine DMSO Affinité Compétition Liaison Solvent Affinity DMSO 570.15
4	Méthodes d'apprentissage statistique pour le criblage virtuel de médicament / Machine learning approaches for drug virtual screening Playe, Benoit 02 July 2019 (has links) Le processus de découverte de médicaments a un succès limité malgré tous les progrès réalisés. En effet, on estime actuellement que le développement d'un médicament nécessite environ 1,8 milliard de dollars américains sur environ 13 ans. Nous nous concentrons dans cette thèse sur des approches statistiques qui criblent virtuellement un grand ensemble de composés chimique contre un grand nombre de protéines. Leurs applications sont polyvalentes : elles permettent d’identifier des candidats médicaments pour des cibles thérapeutiques connues, d’anticiper des effets secondaires potentiels, ou de proposer de nouvelles indications thérapeutiques pour des médicaments connus. Cette thèse est conçue selon deux cadres d'approches de criblage virtuel : les approches dans lesquelles les données sont décrites numériquement sur la base des connaissances des experts, et les approches basées sur l'apprentissage automatique de la représentation numérique à partir du graphe moléculaire et de la séquence protéique. Nous discutons ces approches et les appliquons pour guider la découverte de médicaments. / The rational drug discovery process has limited success despite all the advances in understanding diseases, and technological breakthroughs. Indeed, the process of drug development is currently estimated to require about 1.8 billion US dollars over about 13 years on average. Computational approaches are promising ways to facilitate the tedious task of drug discovery. We focus in this thesis on statistical approaches which virtually screen a large set of compounds against a large set of proteins, which can help to identify drug candidates for known therapeutic targets, anticipate potential side effects or to suggest new therapeutic indications of known drugs. This thesis is conceived following two lines of approaches to perform drug virtual screening : data-blinded feature-based approaches (in which molecules and proteins are numerically described based on experts' knowledge), and data-driven feature-based approaches (in which compounds and proteins numerical descriptors are learned automatically from the chemical graph and the protein sequence). We discuss these approaches, and also propose applications of virtual screening to guide the drug discovery process. Criblage virtuel de médicament Bio-informatique Apprentissage statistique Drug virtual screening Bioinformatics Machine learning 570.15
5	Bioinformatics tools for the systems biology of dysferlin deficiency / Outils de bioinformatique pour la biologie des systèmes de la déficience en dysferline Malatras, Apostolos 13 December 2017 (has links) Le but de mon projet est de créer et d’appliquer des outils pour l’analyse de la biologie des systèmes musculaires en utilisant différentes données OMICS. Ce projet s’intéresse plus particulièrement à la dysferlinopathie due la déficience d’une protéine appelée dysferline qui est exprimée principalement dans les muscles squelettiques et cardiaque. La perte du dysferline due à la mutation (autosomique-récessive) du gène DYSF entraîne une dystrophie musculaire progressive (LGMD2B, MM, DMAT). Nous avons déjà développé des outils bio-informatiques qui peuvent être utilisés pour l’analyse fonctionnelle de données OMICS, relative à la dyspherlinopathie. Ces derniers incluent le test dit «gene set enrichment analysis», test comparant les profils OMICS d’intérêts aux données OMICS musculaires préalablement publiées ; et l’analyse des réseaux impliquant les diffèrent(e)s protéines et transcrits entre eux/elles. Ainsi, nous avons analysé des centaines de données omiques publiées provenant d’archives publiques. Les outils informatiques que nous avons développés sont CellWhere et MyoMiner. CellWhere est un outil facile à utiliser, permettant de visualiser sur un graphe interactif à la fois les interactions protéine-protéine et la localisation subcellulaire des protéines. Myominer est une base de données spécialisée dans le tissu et les cellules musculaires, et qui fournit une analyse de co-expression, aussi bien dans les tissus sains que pathologiques. Ces outils seront utilisés dans l'analyse et l'interprétation de données transcriptomiques pour les dyspherlinopathies mais également les autres pathologies neuromusculaires. / The aim of this project was to build and apply tools for the analysis of muscle omics data, with a focus on Dysferlin deficiency. This protein is expressed mainly in skeletal and cardiac muscles, and its loss due to mutation (autosomal-recessive) of the DYSF gene, results in a progressive muscular dystrophy (Limb Girdle Muscular Dystrophy type 2B (LGMD2B), Miyoshi myopathy and distal myopathy with tibialis anterior onset (DMAT)). We have developed various tools and pipelines that can be applied towards a bioinformatics functional analysis of omics data in muscular dystrophies and neuromuscular disorders. These include: tests for enrichment of gene sets derived from previously published muscle microarray data and networking analysis of functional associations between altered transcripts/proteins. To accomplish this, we analyzed hundreds of published omics data from public repositories. The tools we developed are called CellWhere and MyoMiner. CellWhere is a user-friendly tool that combines protein-protein interactions and protein subcellular localizations on an interactive graphical display (https://cellwhere-myo.rhcloud.com). MyoMiner is a muscle cell- and tissue-specific database that provides co-expression analyses in both normal and pathological tissues. Many gene co-expression databases already exist and are used broadly by researchers, but MyoMiner is the first muscle-specific tool of its kind (https://myominer-myo.rhcloud.com). These tools will be used in the analysis and interpretation of transcriptomics data from dysferlinopathic muscle and other neuromuscular conditions and will be important to understand the molecular mechanisms underlying these pathologies. Bioinformatique Dyspherlinopathie Omics Co-expression Micropuces Transcriptomiques Transcriptomics Microarrays Bioinformatics 570.15
6	Vers une meilleure compréhension des facteurs ayant un impact sur le déclenchement et la diffusion d'une maladie infectieuse : exemple de la grippe saisonnière en France / For a better understanding of factors impacting the onset and the spread of an infectious disease : application to influenza in France Roussel, Marion 27 November 2015 (has links) La gestion des maladies infectieuses est l'un des enjeux majeurs de santé publique, et d'autant plus important dans le contexte actuel de changements globaux (urbanisation, flux migratoires, changement climatique). Pour des maladies à dynamique cyclique comme beaucoup d'infections virales respiratoires (généralement communautaires et hivernales), une gestion adaptée requiert deux éléments fondamentaux : un réseau de surveillance dynamique de médecins de ville et hospitaliers permettant un suivi en temps réel de l'épidémie et une bonne compréhension des facteurs affectant sa diffusion dans le temps et dans l'espace. L'épidémie de grippe saisonnière sévissant en France est un système exemplaire d'infection respiratoire ayant un coût sociétal important. Les données (cliniques et virologiques) accumulées durant ces dernières années par le Réseau des GROG (Groupes Régionaux d'Observation de la Grippe) offrent une opportunité de mieux comprendre le déclenchement et la diffusion des épidémies, d'une part et de mettre en place une méthodologie transversale pouvant être rapidement transposée à d'autres infections respiratoires (émergentes) d'autre part. Mon travail de thèse a consisté dans un premier temps à évaluer l'impact de facteurs climatiques sur la propagation des épidémies de grippe et dans un second temps à estimer l'impact de facteurs de risque de la grippe (flux de mobilité de personnes, facteurs démographiques et climatiques) sur les déclenchements épidémiques. Les résultats obtenus suggèrent un impact significatif de la température et de l'humidité à la fois sur la diffusion globale et sur la variabilité intra-annuelle des déclenchements d'épidémies de grippe en France. Concernant la variabilité régionale des déclenchements épidémiques, elle serait expliquée en partie par des différences de taille de population et de proportions de jeunes (0-19 ans) ainsi que par des flux de mobilité. Ce travail a permis de confirmer et de quantifier, à l'aide de modèles mathématiques, l'impact de différents facteurs de risque de la grippe saisonnière en France. Ces conclusions offrent des opportunités intéressantes pour l'amélioration des mesures de prévention et de contrôle de la grippe en tenant en compte des facteurs mis en évidence / Infectious disease management is one of the major public health issues, and it becomes even more important in the current context of global changes (urbanization, migration flows, climate change). For periodic dynamic diseases like many respiratory viral infections (generally communal and in winter), a suitable management requires two fundamental elements : a dynamic sentinel surveillance network of general practitioners and hospital doctors allowing real-time monitoring of the epidemic; and a good understanding of factors affecting its spread in time and space. Seasonal influenza epidemic spreading in France is an exemplary system of respiratory infection having a significant social cost. Data (clinical and virological) accumulated during last years by the Réseau des GROG (Regional Influenza Surveillance Group) sentinel network offer an opportunity to better understand the onset and spread of epidemics, on the one hand and to set up a transverse methodology that can be rapidly transposed to other (emerging) respiratory infections on the other hand. My PhD work consisted firstly to assess the impact of climatic factors on the spread of influenza epidemics and secondly to estimate the impact of influenza risk factors (mobility flows, demographic and climatic factors) on epidemic onsets. Results suggest a significant impact of temperature and humidity both on the overall spread and on the intra-annual variability of epidemic onsets of influenza epidemics in France. Concerning regional variability of epidemic onsets, it might be explained partially by differences in population sizes and in young proportions (0-19 years old) as well as by mobility flows. This work confirmed and quantified, using mathematical models, the impact of various risk factors of seasonal influenza in France. These findings offer interesting opportunities to improve influenza preventing and controlling measures by taking into account the highlighted factors Biostatistiques Modélisation Maladies infectieuses Grippe Réseaux de surveillance Biostatistics Modelling Infectious diseases Influenza Surveillance network 570.15
7	Étude de la symbiose dans le plancton marin par une approche transcriptome et méta-transcriptome / Study of symbiosis in marine plankton by a transcriptome and meta-transcriptome approach Meng, Arnaud 15 December 2017 (has links) Les relations symbiotiques entre organismes sont essentielles pour l’évolution de la bio- diversité et le fonctionnement des écosystèmes. En milieu terrestre ou en milieu marin benthique les symbioses sont assez bien décrites. Si dans le plancton marin, les relations entre hôtes hétérotrophes et symbiontes photosynthétiques sont des phénomènes observés dès le 19ème siècle, les mécanismes fonctionnels qui régissent ces symbioses restent largement inconnus. C’est le cas de la symbiose entre certaines espèces de radiolaires et leurs symbiontes dinoflagellés. Il s’agit d’un modèle symbiotique, composé de deux unicellulaires eucaryotes, sur lequel je me suis concentré au cours de cette thèse. Ces deux organismes sont connus pour être largement répandus dans les océans et pour leur importance au sein des écosystèmes marins, et il est donc important de mieux caractériser ces symbioses afin d’approfondir nos connaissances de ces organismes. Grâce aux technologies de séquençage haut-débit il est désormais possible d’obtenir, pour ces organismes non cultivables mais isolés depuis l’environnement, une quantité sans précédent d’information génomique. Ces approches représentent une opportunité de décrypter les mécanismes à l’oeuvre dans ces interactions symbiotiques. Mon travail de thèse a combiné la création d’outils bioinformatiques dédiés à l’analyse de données de transcriptomique des holobiontes de radiolaires et dinoflagellés et l’étude de ce modèle de symbiose. Ce travail de doctorat contribue à une meilleure compréhension des mécanismes d’adaptation fonctionnelle et évolutive des organismes photosymbiotiques marins. / Symbiotic associations between organisms are essentials in biodiversity evolution and ecosystems functioning. In terrestrial environments or in the benthic marine environment, the symbioses encountered are fairly well described and studied. In the marine plankton, photosymbioses are phenomena described and observed since the 19th century. However, if the actors of these associations begin to be identified, the fundamental functional mechanisms for the establishment and the maintenance of these symbioses remain largely unknown. This is particularly true for the symbiotic association between symbiotic radiolarians and their dinoflagellate photosymbionts, two unicellular eucaryotes, which I was interested in during this thesis. These two organisms are known to be widespread in the oceans and for their key role in marine ecosystems, and it is therefore important to characterize these symbiotic events in order to deepen our knowledge of these organisms. Thanks to high-throughput sequencing technologies it is now possible to obtain an unprecedented amount of data for these unicellular organisms that are not cultivable and need to be directly isolated from the environment. These new technologies represent a unique opportunity to better characterized the mechanisms involved in these intimate cellular interactions. My Ph.D. work has combined the implementation of bioinformatics protocols and tools dedicated to the assembly and analysis of RNA-seq data as well as to the study of holobiont transcriptomes of radiolarians and dinoflagellates. This thesis contributes to a better understanding of the mechanisms of functional and evolutionary adaptation of marine photosymbiotic organisms. Plancton marin Symbiose Génomique Réseaux de similarité de séquence Radiolaria De novo Marine plankton Symbiosis Genomics 570.15
8	Vers une amélioration de l’analyse des données et une optimisation des plans d’expérience pour une analyse quantitative du risque en écotoxicologie / Towards an improvment of data analysis and experimental design optimisation for ecotoxicology risk assessment Dubuc, Carole 27 March 2013 (has links) En écotoxicologie, les effets des substances toxiques sur les organismes vivants sont classiquement mesurés au niveau individuel, en laboratoire et selon des normes, ce qui assure la reproductibilité des bioessais et le contrôle des facteurs environnementaux. Ces tests standardisés, en toxicité aiguë ou chronique, portent généralement sur la survie, la reproduction et la croissance d'organismes modèles de laboratoire ; leur analyse statistique conduit à l'estimation de concentrations critiques d'effet. Ce sont ces concentrations qui sont utilisées en analyse quantitative du risque en écotoxicologie. Cependant, pour l'estimation d'un même type de concentration critique d'effet, différentes méthodes/modèles peuvent être utilisés qui sont plus ou moins adaptés en fonction du type de jeux de données. Le premier objectif de ce travail de thèse est donc de sélectionner les méthodes/modèles les plus adaptés afin d'améliorer l'analyse des données issus des tests de toxicité et donc l'estimation des concentrations critiques d'effet. Habituellement, les jeux de données sont construits à partir de tests standards en fonction de l'organisme étudié : la durée du test est généralement fixée et des recommandations sont faites, par exemple sur le nombre minimal d'organismes à exposer à un nombre minimal de concentrations. Il est donc légitime de penser que ces recommandations ne sont pas forcément les plus adaptées pour toutes les concentrations critiques d'effet et les méthodes/modèles les plus adaptés. C'est pourquoi, le deuxième objectif de cette thèse est d'optimiser les plans d'expérience afin d'aller soit vers une amélioration des estimations des concentrations critiques d'effet à coût constant soit pour un même niveau de qualité des estimations, d'éviter le gaspillage en temps et en organismes / In ecotoxicology, the effects of toxic compounds on living organisms are usually measured at the individual level, in the laboratory and according to standards. This ensures the reproducibility of bioassays and the control of environmental factors. Bioassays, in acute or chronic toxicity, generally apply to survival, reproduction and growth of organisms. The statistical analysis of standardized bioassays classically leads to the estimation of critical effect concentrations used in risk assessment. Nevertheless, several methods/models are used to determine a critical effect concentration. These methods/models are more and less adapted to the data type. The first aim of this work is to select the most adapted methods/models to improve data analysis and so the critical effect concentration estimation. Usually, data sets are built from standard bioassays and so follow recommendations about exposure duration, number and range of tested concentrations and number of individuals per concentration. We can think that these recommendations are not the most adapted for each critical effect concentration and each method/model. That’s why, the second aim of this work is to optimize the experimental design in order to improve the critical effect concentration estimations for a fixed cost or at least to reduce the waste of time and organisms Concentration critique d’effet Modélisation Optimisation des plans d’expérience Critical effect concentration Modeling Experimental design optimization 570.15
9	Metabolic Investigation of the Mycoplasmas from the Swine Respiratory Tract / Investigation métabolique des mycoplasmes dans le tractus respiratoire des cochons Galvao Ferrarini, Mariana 10 December 2015 (has links) L'appareil respiratoire des porcs est colonisé par plusieurs bactéries, parmi lesquelles trois espèces de mycoplasmes : Mycoplasma flocculare, Mycoplasma hyopneumoniae et Mycoplasma hyorhinis. Lors de ce doctorat, notre principal objectif était de mieux comprendre le métabolisme différentiel dans chacune des espèces à l'aide de différentes approches. Nous avons reconstruit les réseaux métaboliques complets pour toutes les souches séquencées de ces trois espèces de mycoplasmes afin d'y détecter des caractéristiques distinctes. Nous avons pu montrer que, bien que les trois espèces de mycoplasmes du porc ont des capacités métaboliques semblables, certaines différences existent qui incluent, d'une part, le catabolisme de myo-inositol et un système plus complet pour l'absorption du glycérol, et d'autre part, une large gamme de moyens d'absorption de carbohydrates chez M. hyorhinis. L'utilisation de glycérol comme source de carbone, une activité qui est absente uniquement dans M. flocculare, produit du peroxyde d'hydrogène qui est toxique, ce qui peut expliquer l'absence de pathogénicité de cette espèce. L'absorption d'un plus large éventail de sources de carbone chez M. hyorhinis peut également expliquer pourquoi cette espèce est un contaminant largement connu des cultures cellulaires. Des expériences de croissance ont montré que les milieux définis décrits pour d'autres espèces de mycoplasmes ne sont pas appropriés pour la croissance de mycoplasmes du tractues respiratoire de porcs, et que la peptone est essentielle pour le maintien de la viabilité des cellules à la fois de M. hyopneumoniae et de M. flocculare dans des milieux définis. Dans ce travail, nous proposons également de nouveaux média définis qui, in silico, sont extrêmement appropriés pour les mycoplasmes du porc. Les données de métabolomique suggèrent que même si ces espèces sont extrêmement similaires du point de vue de leurs génomes et des métabolismes, les produits et les taux de réaction diffèrent et la régulation des gènes peuvent interférer directement dans le métabolisme. Pour expliquer ces différences ainsi que d'autres décrits dans la littérature qui suggèrent que certains types de régulation de l'expression du gène existent en effet dans ces espèces, nous avons également essayé de recueillir des informations sur de nouvelles séquences promotrices. Ainsi, cette thèse servira de base pour l'étude du métabolisme différentiel et des pathologies causées par les mycoplasmes du tractus respiratoire du porc et pourra aider à proposer des façons de prévenir à l'avenir le développement des maladies associées / In this PhD thesis, we presented three main types of analyses of metabolism, and in most cases involving symbiosis: metabolic dialogue between a trypanosomatid and its symbiont, comparative analyses of metabolic networks and exploration of metabolomics data. The respiratory tract of swines is colonized by several pathogenic bacteria, among which are three mycoplasma species: Mycoplasma flocculare, Mycoplasma hyopneumoniae, and Mycoplasma hyorhinis. In this work, we created whole-genome metabolic network reconstructions for all sequenced strains from these three Mycoplasma species. Similar to other Mycoplasma models all reconstructed networks exhibit low connectivity due to the simplicity of the biological model. We were able to show that the three swine mycoplasma species have similar metabolic capabilities. Interesting metabolic differences include the myo-inositol catabolism and a more complete system for glycerol uptake in M. hyopneumoniae and a wide range of carbohydrate uptake in M. hyorhinis. Glycerol conversion to DHAP, a missing activity only in M. flocculare, produces toxic hydrogen peroxide and may explain the lack of pathogenicity of this species. The uptake of a wider range of carbon sources in M. hyorhinis may also explain why this species is a wide-known contaminant in cell cultures. Growth experiments showed that defined media described for other Mycoplasma species are not suitable for the growth of respiratory tract swine mycoplasmas and that peptone is essential for the maintenance of cell viability of both M. hyopneumoniae and M. flocculare in defined media. Metabolomic data suggests that even though these species are extremely similar from a genomic and metabolic point of views, the products and reaction rates differ and gene regulation may interfere directly in metabolism. This, in turn, may account for many aspects still unknown that influence directly different levels of pathogenicity in each of them Réseaux métaboliques Pathogenicité Mycoplasmes Mollicutes Metabolic networks Pathogenicity Mycoplasmas Mollicutes 570.15
10	Analyses et méthodes pour les données transcriptomiques issues d’espèces non modèles : variation de l’expression des éléments transposables (et des gènes) et variants nucléotidiques / Analyses and methods for RNAseq data from non model species : variation in transposable elements (and genes) expression and detection of single nucleotide variants Lopez-Maestre, Hélène 15 February 2017 (has links) Le développement de la seconde génération de séquenceurs haut débit a généralisé l'accès à l'étude du transcriptome via le protocole RNAseq. Celui-ci permet d'obtenir à la fois la séquence et l'abondance des transcrits d'un échantillon. De nombreuses méthodes bioinformatiques ont été et sont encore développées pour permettre l'analyse des données issues du RNAseq et en tirer le maximum d'information. Ce type d'analyse est notamment possible sans utiliser de génome de référence, et donc pour les espèces modèles ou non-modèles, grâce à des méthodes d'assemblage. Durant ma thèse, j'ai principalement travaillé à partir de données RNA-seq issues d'espèces non modèles. Je me suis intéressée dans un premier temps à l'impacte de l'hybridation inter spécifique sur la stabilité des génomes chez les hybrides issus des croisements réciproques de D. mojavensis et D. arizonae. Nos résultats ne montrent pas une dérégulation globale, mais plutôt quelques gènes et éléments transposables qui sont spécifiquement dérégulés. La pipeline d'analyse mis en place ici sera réutilisée pour l'étude des niveaux d'expression des transcrits chez les mâles ainsi que pour les croisements issus d'autres lignées de D. mojavensis avec D. arizonae, conduisant à une fertilité variable chez les hybrides.Dans un second temps, j'ai participé à la validation du logiciel KisSplice pour la détection de SNP dans des données RNA-seq sans génome de référence. Celui-ci permet de trouver différents types de variants (épissage, indels) directement dans le graphe de de Bruijn construit à partir des lectures séquencées. J'ai également participé au développement d'outils de post-traitement permettant de prédire l'impact des SNP sur les protéines / Next-generation high throughput sequencing technologies provide efficient, rapid, and low cost access to sequencing. Its application to transcriptomes, called RNA-seq, enables the study of both the sequence and the expression of the transcripts. Many bio-informatics methods are still developed for RNA-seq data processing, trying to get the maximum out of it. Assembly methods allow us to study non-model species (no reference genome available) as well as model species. The work presented here is mostly related to RNA-seq data on non-model species.In the first study, to understand the initiation of hybrid incompatibility, we performed a genome-wide transcriptomic analysis on ovaries from parental lines and on hybrids from reciprocal crosses of \emph{D. mojavensis} and \emph{D. arizonae}. We didn't see a global deregerulation of genes or transposable element. Instead, we show that reciprocal hybrids presented specific gene categories and few transposable element families misexpressed relative to the parental lines.Â The analytical workflow developed for this project will be used to analyze transcriptomic data from the testis, but also to study the reciprocal crosses from other lines of D. mojavensis with D. arizonae leading to variable levels of sterility in hybrids. A second project tacked here is the identification and quantification of SNPs from RNA-seq data without a reference genome with KisSplice. Kissplice was developed to identified several type of variants (splicing events, indels) directly from the de Bruijn graph, build from the sequenced reads. We also developed other KisSplice-tools, for downstream analyses of the SNPs, including the prediction of their impact on the protein sequence RNA-Seq Assemblage Snp Elements transposables RNA-Seq Assembly Snp Transposable element 570.15

Search results