Global ETD Search

81	Sources des mycobactéries non-tuberculeuses dans les bassins versants / Sources of nontuberculous mycobacteria in watersheds Radomski, Nicolas 28 February 2011 (has links) L'eau et le sol sont considérés comme des sources potentielles de mycobactéries non-tuberculeuses (MNT). Parmi les infections humaines causées par les MNT d'origine environnementale, les infections pulmonaires et cutanées sont souvent décrites. Le manque de connaissances sur leur cycle de vie dans l'environnement requiert des outils analytiques, qui ne sont actuellement pas adaptés à ce type d'échantillons. Cette thèse vise donc premièrement à proposer des méthodes de quantification en bactériologie et en biologie moléculaire dans le but de déterminer les sources des MNT dans les bassins versants. Ainsi, la comparaison des méthodes d'isolement de MNT a montré que le traitement au chlorure de cetylpyridininium de l'eau suivi d'une culture en milieu riche supplémenté par un mélange d'antibiotiques (polymyxine B, amphotéricine, acide nalidixique, triméthoprime, carboxy-pénicilline) limitait la croissance des microorganismes interférents et éliminait moins de MNT que les autres méthodes comparées (Radomski et al. 2010, doi: 10.1128/AEM.00942-10). Bien que des espèces de MNT potentiellement pathogènes aient été isolées de l'eau de surface de la Seine en utilisant ces outils bactériologiques, la quantification des MNT ne s'est pas avérée reproductible. En conséquence, une méthode de quantification par polymérisation en chaîne en temps réel (qPCR) a été développée pour énumérer le genre Mycobacterium dans l'eau (Radomski et al. 2010, doi: 10.1128/AEM.02659-09). La nouvelle méthode développée, ciblant l'ARNr 16S, était plus spécifique que les autres méthodes qPCR publiées, ciblant un autre locus de l'ARNr 16S et le gène hsp65 (respectivement 100 % versus 44 % et 91 %). La comparaison des méthodes d'extraction d'ADN mycobactérien a montré que la lyse enzymatique combinée au bromure d'hexadécyltriméthylammonium était la procédure la plus efficace pour énumérer par qPCR les MNT dans des échantillons environnementaux. Ainsi, ces méthodes d'extraction d'ADN et de qPCR ont été utilisées pour étudier des sources de MNT dans des bassins versants. Dans un second temps, nous avons étudié trois sources potentielles de MNT : une ponctuelle et deux diffuses. Plus précisément, une station d'épuration (STEP) a été choisie comme source ponctuelle de MNT et a été étudiée en temps sec en fonction d'indicateurs de contamination fécale et des paramètres globaux habituellement contrôlés. Les MNT ont atteint 5,52×105±3,97×105 copies/L dans l'eau en entrée de STEP (84 % d'échantillons positifs), n'ont pas été détectées dans l'eau en sortie de STEP après décantation physico-chimique et biofiltration et ont été estimées à 1,04×106 ±1,75×106 copies/g dans les boues de STEP (50 % d'échantillons positifs). La plupart des MNT (98±2 %, correspondant à 2,45±0,78 log10) ont été éliminées par décantation physico-chimique et les MNT restantes (0,74×104 ±1,40×104 copies/L) ont été éliminées par biofiltration (53 % d'échantillons positifs). Ces résultats ont montré également que Mycobacterium, Escherichia coli et les entérocoques intestinaux possèdent des comportements significativement différents conduisant respectivement à trois modèles : hydrophobe, hydrophile et intermédiaire. Concernant les sources diffuses, la densité de MNT a été mesurée dans divers sols ruraux et urbains qui ont été caractérisés par différents paramètres physico-chimiques. Les densités de MNT les plus importantes ont été mesurées dans des sols de forêts tourbeuses (9,27×104±5,00×104 copies/g sec) et dans des sols faiblement urbanisés proches de marécages côtiers (1,71×106±2,85×106 copies/g sec) alors qu'aucune MNT n'a été détectée dans les autres types de sols étudiés. De plus, la densité de MNT a été significativement associée à des sols proches de zones acides et des teneurs fortes des sols en eau, matière organique et fer. Ces résultats suggéreraient que les MNT sont dépendantes de leur production intra et extracellulaire de chélateurs de fer et indiqueraient que les zones faiblement urbanisées pourraient être impactées par la proximité de marais acides. Afin d'étudier une autre source diffuse, les MNT et d'autres paramètres ont été mesurés lors d'événements pluvieux dans l'eau de surface de la Marne et de ses principaux affluents. Les densités de MNT ont été estimées à 2,16×105±2,36×105 copies/L dans environ 20 % des échantillons d'eau collectés, et elles ne différaient pas entre les zones péri-urbaines et rurales échantillonnées. Nos résultats ont montré que la pluviométrie et la durée de l'évènement expliquaient la diminution du nombre de MNT détectées dans l'eau de surface au cours de l'événement pluvieux de faible intensité (6,6 mm/h de pluviométrie cumulées en 5,5 h). Ces résultats ont souligné que certains affluents de la Marne pouvaient apporter des MNT en temps sec, mais qu'au cours de l'évènement pluvieux suivi les densités de MNT diminuaient.En guise d'amélioration à ces études appliquées, des réflexions sur les défis relatifs à la surveillance des microorganismes pathogènes dans l'environnement ont été explorées. En nous focalisant sur la MNT la plus pathogène, M. avium, nous avons discuté des défis de la détection et de l'énumération et proposé un guide d'adaptation des méthodes médicales aux échantillons environnementaux (Radomski et al. 2011, ed. A. Méndez-Vilas, Vol. 2). Ce guide se présente sous la forme d'un arbre de décision permettant de choisir les outils analytiques les plus appropriés pour surveiller les microorganismes pathogènes dans l'environnement. De plus, une stratégie in silico de comparaison de génomes bactériens totalement séquencés a été développée dans le but de décrire des nouvelles cibles de détection. L'analyse in silico des génomes totalement séquencés a permis de détecter 11 protéines présentant entre 80 % et 100 % de similarité dans les génomes mycobactériens et moins de 50 % de similarité dans les génomes non-mycobactériens des genres Corynebacterium, Nocardia et Rhodococcus. Sur la base d'alignements des séquences d'ADN de ces cibles potentielles, il a été possible de dessiner des amorces PCR et une sonde pour détecter le gène codant la sous-unité C de la synthase de l'adénosine triphosphate qui semble exclusivement conservée dans le génome mycobactérien. Le développement d'outils analytiques, en particulier la qPCR, a permis de montrer qu'une STEP éliminait efficacement les MNT et que le traitement des eaux usées est nécessaire pour préserver l'eau de surface de cette source ponctuelle de MNT. Il a été mis en évidence que les événements pluvieux diminuent la densité de MNT dans l'eau de surface et que les sols acides sont des sources naturelles majeures de MNT qui pourraient impacter des zones faiblement urbanisées en temps de pluie via le ruissellement. Concernant les réflexions sur la surveillance des microorganismes pathogènes dans l'environnement, l'arbre de décision des outils analytiques appropriés et la nouvelle stratégie in silico de détection de cibles moléculaires pourraient être appliqués pour l'étude d'autres microorganismes de l'environnement / Water and soil are considered as potential sources of nontuberculous mycobacteria (NTM) infections. Among human infections caused by environmental NTM, pulmonary infections and cutaneous infections are often described. However, lack of knowledge about their life cycle in the environment requires analytical tools, which are not currently adapted to these kinds of samples. The aim of this thesis is to propose bacteriological and molecular quantitative methods, in order to determine the sources of NTM in watersheds. Comparison of NTM isolation methods showed that treatment with cetylpyridinium chloride of water, followed by culture on a rich medium supplemented with antibiotic cocktail (polymyxin B, amphotericin, nalidixic acid, de trimethoprim, azlocillin) decreased the growth of nontarget microorganisms, while inhibiting less NTM than the other compared methods (Radomski et al. 2010 doi: 10.1128/AEM.00942-10). Although potentially pathogenic NTM species were isolated from surface water of the Seine River using these bacteriological tools, enumeration of NTM was not reproducible. Consequently, a quantitative real-time polymerase chain reaction (qPCR) method was developed in order to enumerate Mycobacterium spp. in water (Radomski et al. 2010 doi: 10.1128/AEM.02659-09). This newly developed method, targeting 16S rRNA, was more specific than the two previously published qPCR methods targeting another 16S rRNA locus and the hsp65 gene (100% versus 44% and 91%, respectively). Comparison of DNA extraction methods showed that the enzymatic lysis and hexadecyltrimethylammonium bromide procedure was the most effective combination for mycobacterial DNA extraction with the aim to enumerate NTM in environmental samples by qPCR. Thus, these extraction and qPCR methods were used in order to study NTM sources in watersheds.Secondly, we studied three potential sources of NTM : one point source and two nonpoint sources. More precisely, a wastewater treatment plant (WWTP) was chosen as a potential point source of NTM and was studied according to indicators of fecal contamination and usually monitored parameters. NTM reached 5.52×105±3.97×105 copies/L in the influent of WWTP (84% of positive samples). They were not detected in the effluent after physico-chemical decantation and biofiltration, and were estimated at 1.04×106 ±1.75×106 copies/g in sludge (50% of positive samples). Most NTM (98±2%, i.e. 2.45±0.78 log10) were removed by the physical-chemical decantation, and the remaining NTM (0.74×104 ±1.40×104 copies/L) were removed by biofiltration (53% of positive samples). These results showed also that Mycobacterium, Escherichia coli and intestinal enterococci follow significantly different behaviors as hydrophobic, hydrophilic and intermediate models, respectively. Concerning the nonpoint sources, NTM were enumerated in a variety of rural and urban soils which were characterized by different physico-chemical parameters. The highest NTM densities were measured in peat forest soils (9.27×104±5.00×104 copies/g dw) and in lightly urbanized soils near a costal swamp (1.71×106±2.85×106 copies/g dw), whereas they were not detected in the other monitored soils. NTM density was significantly associated with soils near acidic areas and high moisture, organic matter, and iron content in soils. These results emphasized that NTM are dependent upon the production of surface and extracellular iron-binding compounds, and may mean that lightly urbanized area could be impacted by the proximity of the acidic swamp. In order to study another nonpoint source, NTM and other parameters were measured during wet events in surface water of Marne River and their main effluents. NTM density was estimated at 2.16×105±2.36×105 copies/L in about 20% of surface water samples, and NTM densites did not differ among rural and peri-urban sampling areas. Our results showed that the pluviometry and rain duration explained the decrease of detected NTM abundances in surface water during a slightly intense wet event (6.6 mm/h of cumulated rain during 5.5 h). These results emphasized that some tributaries of the Marne River may constitute a source of NTM, however their influence on NTM density in surface water of the Marne River decreased during the slightly intense wet event.In order to improve these applied studies, challenges dealing with pathogenic microorganism monitoring in environment were explored. Focusing on the most pathogenic NTM, M. avium, we discussed the challenges for detection and enumeration and proposed a guidance for the adaptation of clinical methods to environmental samples (Radomski et al. 2010 ed. A. Méndez-Vilas, Vol. 2). This guidance was proposed as a decision tree allowing to choose the most suitable analytical tools in order to monitor pathogenic microorganisms in environment. Moreover, an in silico strategy of whole sequenced bacterial genome comparison was developed in order to describe new targets for NTM detection. In silico analysis of whole sequenced genomes allowed to detect 11 proteins showing between 80% and 100% of similarity with mycobacterial genomes, and less than 50% of similarity with closely related genomes of Corynebacterium, Nocardia and Rhodococcus genera. Based on the DNA sequence alignments of these potential targets, it was possible to design a primer pair and a probe in order to detect by PCR the gene coding for adenosine-5'-triphosphate synthase subunits C which seems exclusively conserved in mycobacterial genome.Using the developed analytical tools, especially the qPCR, we showed that a WWTP removed efficiently NTM from the influent, and that waste water treatment is necessary in order to preserve surface water against this NTM point source. It was shown that storm events decrease NTM densities in surface water and in contrast that acidic soils are major NTM natural sources which may impact lightly urbanized areas during wet weather when runoff water suspends soil matter. Concerning challenges dealing with pathogenic microorganism monitoring in environment, the decision tree of suitable analytical tools and the new in silico strategy of molecular target detection might be also useful for the study of other environmental microorganisms Mycobacterie Bacteriologie Biologie moleculaire Eau Sol ADN Bioinformatique Mycobacteria Bacteriology Molecular biology Water Soil DNA Bioinformatic
82	Analyse bioinformatique du transcriptome des champignons mycorhiziens Tuber melanosporum et Glomus intraradices / Bioinformatic analysis of the transcriptome of mycorrhizal fungi Tuber melanosporum and Glomus intraradices Tisserant, Emilie 15 December 2011 (has links) La symbiose mycorhizienne est une interaction mutualiste formée entre les racines des plantes terrestres et des champignons du sol. Les changements morphoanatomiques associés au développement de cette symbiose sont accompagnés de modifications dans la régulation de l'expression génique. L'étude des profils transcriptomiques est donc fondamentale afin de caractériser les mécanismes moléculaires gouvernant la symbiose mycorhizienne. Le développement récent des approches de transcriptomique à haut débit offre de nouvelles perspectives pour la compréhension de ces mécanismes. Le travail entrepris dans le cadre de ce projet de thèse visait à caractériser in silico le transcriptome symbiotique du champignon ectomycorhizien Tuber melanosporum et du champignon endomycorhizien Glomus intraradices. Il s'agissait de mettre en place les outils et les protocoles bioinformatiques permettant l'exploitation des données transcriptomiques issues des nouvelles technologies de séquençage, afin de caractériser les transcrits exprimés par les symbiotes et d'identifier les gènes régulés au cours de la symbiose. Ce travail original a permis de souligner l'existence de traits communs aux profils d'expression des champignons mycorhiziens. De plus, la caractérisation du transcriptome de G. intraradices a permis d'établir le premier répertoire de gènes à l'échelle du génome pour un champignon endomycorhizien. Cette étude de génomique contribue à l'amélioration des connaissances sur les processus moléculaires qui sous-tendent la symbiose mycorhizienne et constitue une ressource unique pour de futures recherches sur les réseaux de gènes contrôlant la symbiose / Mycorrhizal symbiosis is a mutualistic interaction involving roots of terrestrial plants and soil fungi. Morphological changes associated with the development of this symbiosis are accompanied by changes in gene expression. The study of transcriptomic profiles is thus essential to characterize the molecular mechanisms that govern the mycorrhizal symbiosis. The recent development of high-throughput transcriptomic approaches provides new insights for the understanding of these mechanisms. The work undertaken during this thesis aimed to characterize in silico the transcriptome of the ectomycorrhizal fungus Tuber melanosporum and the endomycorrhizal fungus Glomus intraradices. In order to characterize transcripts expressed by the symbionts and to identify genes regulated during symbiosis, bioinformatic tools and protocols were implemented to process transcriptomic data derived from new sequencing technologies. This work has allowed to highlight common features in the expression profiles of mycorrhizal fungi. In addition, characterization of the G. intraradices transcriptome has allowed to establish the first genome-wide repertoire of genes for an endomycorrhizal fungus. The study helps to improve knowledge about the molecular processes underlying the mycorrhizal symbiosis and provides a unique resource for future research on the gene networks controlling symbiosis Symbiose Champignons Mycorhize Transcriptomique Bioinformatique 454 RNA-Seq 572.802 85 579.617 85
83	Décompositions et Visualisations de graphes : applications aux données biologiques Bourqui, Romain 24 October 2008 (has links) La quantité d’informations stockée dans les bases de données est en constante augmentation rendant ainsi nécessaire la mise au point de systémes d’analyse et de visualisation. Nous nous intéressons dans cette thèse aux données relationnelles et plus particulièrement aux données biologiques. Cette thèse s’oriente autour de trois axes principaux : tout d’abord, la décomposition de graphes en groupes d’éléments ”similaires” a?n de détecter d’éventuelles structures de communauté ; le deuxième aspect consiste à mettre en évidence ces structures dans un système de visualisation, et dans un dernier temps, nous nous intéressons à l’utilisabilité de l’un de ces systèmes de visualisation via une évaluation expérimentale. Les travaux de cette thèse ont été appliqués sur des données réelles provenant de deux domaines de la biologie : les réseaux métaboliques et les réseaux d’interactions génes- protéines. / The amount of information stored in databases is constantly increasing making necessary to develop systems for analysis and visualization. In this thesis, we are interested in relational data and in particular, in biological data. This thesis focuses on three main axes : ?rstly, the decomposition of graph into clusters of ”similar” elements in order to detect the community structures ; the second aspect is to highlight these structures in a visualization system; and thirdly, we are interested in the usability of one of these visualization systems through an experimental evaluation. The work presented in this thesis was applied on real data from two ?elds of biology : the metabolic networks and the gene-protein interaction networks. Visualisation de graphe Bioinformatique Evaluation Décomposition de graphe Graph visualization Graph decomposition Evaluation Bioinformatic
84	Découverte d'éléments cis-régulateurs impliqués dans l'activation transcriptionnelle du génome zygotique dans l'embryon précoce de Drosophila melanogaster Darbo, Elodie 16 December 2011 (has links) Chez les métazoaires, la transcription est inactive durant les étapes précoces du développement embryonnaire. Chez Drosophila melanogaster, des études récentes de l'activation du génome zygotique (AGZ) ont mis en évidence l'implication de quelques acteurs moléculaires (Zelda, STAT92E), mais les mécanismes régulateurs généraux restent à découvrir. En appliquant des méthodes bioinformatiques à l'analyse de données à haut débit de différentes sources, j'ai recherché de nouveaux éléments cis-régulateurs impliqués dans l'AGZ. Tout d'abord, par l'analyse de données transcriptomiques, j'ai sélectionné un groupe de gènes activés pendant l'AGZ. L'analyse de leurs régions non codantes a mis en évidence neuf motifs, dont trois correspondent à des motifs connus (Zelda, Trl et facteur TTK). La recherche systématique de ces motifs m'a permis de prédire des modules cis-régulateurs (CRMs) potentiels pour lesquels j'ai défini un environnement chromatinien spécifique en analysant des profils d'occupation de (co-) facteurs de transcription pertinents et d'histones modifiées (ChIP-seq) ainsi que des profils d'ouverture de la chromatine. L'ensemble de ces résultats m'a permis de définir un modèle de régulation de l'AGZ et de sélectionner des régions candidates pour une validation expérimentale. / In metazoa, transcription is silent during early embryogenesis. In Drosophila melanogaster, recent studies of the zygotic genome activation (ZGA) highlighted the implication of few molecular actors (Zelda, STAT92E), but general regulatory mechanisms remains to be understood. Applying bioinformatics analyses on different type of high-throughput data, I searched for new cis-regulatory elements involved in ZGA.First, through analysis of transcriptome data, I selected a group of genes activated during ZGA. Analysis of their non-coding sequences highlighted nine motifs, of which three correspond to known binding motifs and factors (Zelda, Trl and TTK). Systematic research of these motifs led to the prediction of putative cis-regulatory modules (CRMs) for which I defined a specific chromatin environment analyzing occupancy profiles of relevant transcription (co-) factors and modified histones, as well as profiles of chromatin opening. Altogether, these results allowed me to define a regulatory model of the ZGA and select candidate regions for further experimental validation. Transcription Drosophila melanogaster Embryogenèse précoce Bioinformatique Transcription Drosophila melanogaster Early embryogenesis Bioinformatics
85	Synaptic plasticity emerging from chemical reactions : Modeling spike-timing dependent plasticity of basal ganglia neurons / Emergence de la plasticité synaptique à partir des réactions biochimiques : Modélisation de la plasticité dépendante du timing du potentiel d'action (STDP) des neurones des ganglions de la base Prokin, Ilia 02 December 2016 (has links) Notre cerveau prend en charge différentes formes d’apprentissage dans ses diverses parties. C’est par exemple le cas des ganglions de la base, un ensemble de noyaux sous-corticaux qui est impliqué dans la sélection de l’action et une forme spécifique de l’apprentissage / mémoire, la mémoire procédurale (mémoire des compétences ou d’expertise). A l’échelle du neurone unique, le support le plus plausible de l’apprentissage et de la mémoire est la plasticité synaptique, le processus par lequel l’efficacité de la communication entre deux neurones change en réponse à un pattern spécifique de conditions environnementales. Parmi les différentes formes de plasticité synaptique, la plasticité dépendante du timing des spikes (STDP) représente le fait que le poids synaptique (l’efficacité de la connexion) change en fonction du temps écoulé entre l’émission des deux potentiels d’action (spikes) présynaptiques et postsynaptiques consécutifs. Si la STDP est une forme de plasticité qui a récemment attiré beaucoup d’intérêt, on ne comprend pas encore comment elle émerge des voies de signalisation / biochimiques qui la sous-tendent. Pour répondre à cette question, nous combinons les approches expérimentales de nos collaborateurs (pharmacologie et électrophysiologie) avec la modélisation de la dynamique des réseaux de signalisation impliquées (décrite par des équations différentielles ordinaires). Après estimation des paramètres, le modèle reproduit la quasi-totalité des données expérimentales, y compris la dépendance de la STDP envers le nombre stimulations pré- et post-synaptiques appariées et son exploration pharmacologique intensive (perturbation des voies de signalisation par des produits chimiques). En outre, contrairement à ce qui était largement admis dans la communauté des neurosciences, notre modèle indique directement que le système endocannabinoïde contrôle les changements du poids synaptique de façon bi-directionnelle (augmentation et diminution). De plus, nous étudions comment une série de facteurs comme la recapture du glutamate régule la STDP. Notre modèle représente une première étape pour l’élucidation de la régulation de l’apprentissage et de la mémoire au niveau du neurone unique dans les ganglions de la base. / Our brains support various forms of learning in their various subparts. This is for instance the case of the basal ganglia, a set of subcortical nuclei that is involved in action selection and a specific form of learning / memory, procedural memory (memory of skills or expertise). At the scale of single neurons, the most plausible support of learning and memory is synaptic plasticity, the process by which the efficiency of interneuronal communication changes in response to a pattern of environmental conditions. A recent focus of research is on spike-timing dependent plasticity (STDP), whereby the relative timing of activations (spikes) of connected pre- and postsynaptic neurons, determines the synaptic weight (the efficiency of synaptic connection). Notwithstanding, the dependence of STDP on underlying signaling pathways is not yet fully understood. To address this issue, we combine experimental approaches by our collaborators (pharmacology and electrophysiology) with modeling of the implicated signaling network (described by Ordinary-Differential Equations). After parameter estimation, the model reproduces much of experimental data, including the dependence of STDP on the number of paired stimuli of pre- and postsynaptic neurons and intensive pharmacological exploration (where signaling molecules are perturbed by chemicals). Furthermore, in opposition to what was widely believed in the neuroscience community, our model directly indicates that the endocannabinoid system supports bidirectional changes of the synaptic weight (increase and decrease). Moreover, we study how a range of factors including glutamate uptake regulates STDP. We expect our model to be a starting point to the elucidation of the regulation of learning and memory in the basal-ganglia at the single neuron level. Bioinformatique Neurosciences computationnelles Plasticité synaptique Ganglions de base Biocomputing Computational neurosciences Synaptic plasticity Basal ganglia 570.285 072
86	Lien entre les réarrangements chromosomiques et la structure de la chromatine chez la Drosophile / Linking large scale genome rearrangement to chromatin structure in Drosophila Pulicani, Sylvain 28 November 2018 (has links) Entre espèces, les génomes présentent des différences dans leur organisation, que ce soit au niveau du caryotype ou de l'ordre des gènes. Ceci reste vrai même entre espèces relativement proches comme l'humain et la souris, et est du aux réarrangements chromosomiques. Reconstruire l'histoire évolutive d'une lignée revient donc à déterminer des scénarios de réarrangements qui transforment un génome actuel en un autre. Le génome ancestral se trouve alors être l'un des états intermédiaires atteint par l'un de ces scénarios.Les réarrangements chromosomiques sont des évènements biologiques violents pour la cellule. En effet, de nombreux mécanismes moléculaires ont pour fonction de stopper le cycle cellulaire dans le cas où le génome aurait été altéré. De plus, les réarrangements peuvent être à l'origine de phénotypes aberrants, et donc probablement désavantageux pour leur porteur. Au vu de tout cela, il paraît raisonnable de poser l'hypothèse selon laquelle les scénarios de réarrangements sont parcimonieux.Cependant, il est admis que ce seul critère ne permet pas de reconstruire efficacement l'histoire évolutive des génomes. En effet, quelque soit le modèle utilisé pour générer les scénarios, leur nombre est exponentiel en le nombre de réarrangements. Une autre contrainte biologique doit donc être ajoutée. La conservation de la structure spatiale de la chromatine pourrait être un critère manquant essentiel. Il a été montré in vitro que lors d'une cassure double-brin suivie d'une réparation non-homologue, le brin utilisé pour la réparation se situe spatialement proche de la cassure. Notre hypothèse est donc que les points de cassures qui sont proches en 3D ont plus probablement participé à des réarrangements que les autres. Cela est appuyé par des analyses génomiques sur des cellules somatiques et entre espèces. Nommons cette hypothèse: l'hypothèse de localité.Notre approche a été de proposer une méthode pour utiliser l'information structurale afin de prioriser les scénarios de réarrangements. Les données de Hi-C ont été l'information structurale qui nous a permis d'appliquer la méthode aux scénarios entre D. melanogaster et D. yakuba.Ces résultats nous ont ensuite menés à nous demander si la structure de la chromatine ne pouvait pas elle-même évoluer. Elle serait alors susceptible d'être considérée comme un caractère phylogénétique. Cette idée est appuyée par d'autres résultats montrant la conservation de domaines topologiques entre espèces.Cette question ne semble pas avoir été posée auparavant. Elle est pourtant très intéressante car elle permet d'ouvrir tout un champ d'étude. En effet, si la structure de la chromatine porte un signal phylogénétique, alors il devient possible de s'interroger sur les mécanismes en œuvre lors de la sélection, ou sur la possibilité de reconstruire l'état ancestral de cette structure. Par la suite, il serait même possible de comparer l'évolution de la séquence et celle de la structure de la chromatine.Nous avons ainsi défini une distance entre les structures des génomes, basée sur la comparaison des contacts entre loci orthologues. Nous l'avons appliquée à une ensemble de six espèces comprenant l'humain, la souris et quatre drosophiles. Ces résultats confirment la présence d'un signal phylogénétique dans la structure spatiale des génomes. Ils mettent également en lumière l'intérêt de la mise en place de méthodes permettant de comparer efficacement des données de contacts entre espèces. / Different species have different genome organization. Whether it be the karyotype or gene order, these differences are seen even with relatively close species like Human and Mouse. This is caused by the chromosomal rearrangement. Infererence of rearrangement scenarios that transform one present-day species into another can give insight into evolutionary states, the ancestral genome being one of the intermediates of the true scenario.The chromosomal rearrangements are violent biological events for the cell. Indeed, numerous mechanisms are present to stop the cell cycle when the genome sequence is altered. Moreover, rearrangements can be the source of aberrant phenotypes, which are probably unfavorable for the carrier. With all that, it seams reasonable to assume the rearrangement scenarios are parsimonious.However, it is accepted that this criterion alone is not sufficient to efficiently build the evolutionary history of the genomes. Indeed, for whatever model we choose, the number of scenario is exponential in the number of rearrangements. Another biological constraint is needed. The spatial structure of the chromatin could be an essential missing criterion. It has been shown in vitro that when a double-stranded break of the DNA is non-homologously repaired, the strand used for repairing is close in space to the breakpoint. Our hypothesis is that the closer the breakpoints are in space, the more probable they are to participate in a rearrangement. This hold on genomics analysis of somatic cells, and between species. Let's name that hypothesis the locality hypothesis.We proposed a method to use the structural information in order to prioritize the rearrangements scenarios. The Hi-C data were the structural information that allowed us to apply our method to scenarios between D. melanogaster and D. yakuba.This results led us to ask whether the chromatin structure could evolve by itself. Then, it could be used as a phylogenetic mark. This idea is related to previous results showing the conservation of topological domains between species.This question seams to be new, and could open a new line of investigation. If the chromatin structure holds a phylogenetical signal, it becomes possible to ask ourselves about the mechanisms that occur during the selection, or if it is possible for the ancestral state to be inferred. Then, it could even be possible to compare the evolution of the sequence with the one of the chromatin structure.Thus, we defined a distance between genome structures, based on the comparison of contacts between orthologous loci. We applied this distance to a set of six species, including the Human, the Mouse and four Drosophila. This result confirms the presence of a phylogenetic signal in the spatial structure of the genomes. They also showed that we're in need for efficient methods to compare contacts data between species. Chromosome Evolution Drosophile Génome Bioinformatique Génomique Comparative Chromosome Evolution Drosophila Genome Bioinformatics Comparative Genomics
87	Bioinformatic approaches to the study of TAL effector evolution and function / Étude de l’évolution et de la fonction des effecteurs TAL par des approches bioinformatiques Perez Quintero, Alvaro Luis 21 April 2017 (has links) Les effecteurs TAL (« Transcription Activator-Like ») sont des protéines présentes majoritairement chez les bactéries phytopathogènes du genre Xanthomonas. Ces protéines bactériennes sont dirigées vers le noyau des cellules de la plante hôte où elles induisent l’expression de gènes. L’induction de gènes de « susceptibilité » de la plante est responsable de la maladie. Les effecteurs TAL sont capables de se lier à l’ADN grâce à un motif particulier consistant en une série de répétitions quasi-identiques s’enroulant autour de l’ADN et formant une super-hélice. Au sein des répétitions deux acides aminés localisés à l’intérieur de chaque boucle de la super-hélice interagissent directement et spécifiquement avec les nucléotides. Des combinaisons différentes de ces deux acides aminés se lient spécifiquement à certains nucléotides, selon un code unique.Une conséquence de cette interaction étroite est que les plantes et les bactéries co-évoluent selon une course aux armements où le génome de la plante se diversifie pour éviter d’être la cible des effecteurs TAL, tandis que les gènes tal se diversifient pour s’adapter à de nouvelles cibles. Les aspects évolutifs des effecteurs TAL sont encore largement inconnus, notamment comment la spécificité évolue vers de nouvelles cibles végétales. Cette thèse présente les premiers travaux sur la compréhension des mécanismes évolutifs des gènes tal, principalement abordés par la bioinformatique. Nous avons développé la suite de programmes « QueTAL » qui permet d’une part la construction d’arbres phylogénétiques basés soit sur la séquence des répétitions, soit sur la séquence des sites cibles, d’autre part la recherche de motifs de répétitions pouvant constituer les unités évolutives des effecteurs TAL. Cette suite bioinformatique est publique, en ligne, et activement utilisée par la communauté des scientifiques travaillant sur les effecteurs TAL des Xanthomonas.Ces programmes ont été appliqués (ainsi que d’autres approches) à plus de 900 séquences d’effecteurs TAL de 22 groupes bactériens. Nous avons mis en évidence i) une perte de diversité dans les répétitions chez les Xanthomonas, qui aurait des conséquence sur l’évolution de la structure des effecteurs TAL; ii) l’existence de groupes fonctionnels de gènes tal spécifiques à certains pathovars ; iii) un probable mécanisme évolutif reposant sur la recombinaison (principalement par conversion génique), révélé par le gain ou la perte de répétitions en blocs entiers. Notre hypothèse est que le moteur de la spécialisation des effecteurs TAL est la recombinaison de ces blocs entre gènes conduisant à une diversification fonctionnelle rapide vers de nouvelles cibles végétales.Nous avons ensuite analysé plus en détail la diversité des séquences TAL de souches africaines de Xanthomonas oryzae pv. oryzae (Xoo), agent de la bactériose vasculaire, maladie bactérienne la plus importante du riz. Nous avons montré qu’un gène tal résultant d’une conversion génique pouvait être fonctionnel, indiquant que ce mécanisme peut être un moteur évolutif chez les effecteurs TAL. Les données de transcriptomique et de gain de fonction ont permis de mettre en évidence un effecteurs TAL dont la virulence s’exerce par l’activation de deux gènes de susceptibilité, dont l’un n’avait jamais été décrit chez Xoo. Enfin nous présentons des résultats préliminaires sur les effets d’une déconstruction de TALome sur le transcriptome de riz ainsi que des travaux fonctionnels et évolutifs issus de collaborations sur d’autres Xanthomonas.Cette thèse offre un nouveau cadre conceptuel ainsi que de nouveaux outils pour l’analyse fonctionnelle et évolutive des effecteurs TAL qui devraient améliorer la mise au point de stratégies pour la résistance des plantes aux Xanthomonas. / Transcription activator-like (TAL) effectors are proteins found mainly in the genus of Xanthomonas phytopathogenic bacteria. These proteins enter the nucleus of cells in the host plant and can induce the expression of genes. The induction of “susceptibility” S genes in the plant will result in disease. TAL effectors are able to bind DNA thanks to a unique motif consisting of a series of nearly-identical repeats that wrap around the DNA forming a super-helix, in each repeat two amino-acids found in a loop on the inner side of the helix directly interact with nucleotides. Different combination of amino-acids in this loop bind specific nucleotides following a unique code.A consequence of this tight interaction is that plants and bacteria co-evolve following an arms race where the plant genome diversifies to avoid being targeted by the TAL effectors, while tal effector genes diversify to adapt to new targets.Various aspects of TAL effector evolution are still unknown, specially how does specificity arise towards certain targets in the host plant? As first steps towards answering this question, in these thesis we show the results of using primarily bioinformatic strategies to find evolutionary patterns in TAL effector sequences. We designed the suite “QueTAL” containing software for 1) the construction of phylogenetic trees based on repeat sequences, 2) comparison of predicted binding sites for TAL effectors, 3) identification of repeat motifs in TAL effector pairs. This suite was made publicly available and it is being actively used by the Xanthomonas research community.We used these programs along with other strategies to analyze variation in over 900 TAL effector sequences from 22 taxonomic groups finding 1) a loss of diversity of repeats through the Xanthomonas genus, which may impact the evolution of TAL effector architecture, 2) groups of TAL effector orthologs specific to certain taxonomic groups of pathovars that may share common functions, 3) evidence of repeat motifs shared and lost between TAL effectors hinting at extensive recombination (particularly gene conversion) events. We propose that the swapping of repeat blocks between TAL effectors is a motor for TAL effector specialization that allows for fast functional diversification through the acquisition of new targets in the host plants.We then analyzed in detail the diversity of TAL effector sequences in African strains of Xanthomonas oryzae pv. oryzae (Xoo), causing agent of bacterial leaf blight of rice, the most destructive bacterial disease in rice. We found indications of virulence activity of a TAL effector being the product of a gene conversion event, supporting our hypothesis of gene conversion as a motor of TAL effector evolution. We also used transcriptomic data and systematic gain-of-function assays to uncover a TAL effector that exerts a virulence role through the induction of two susceptibility genes, one of which represents a novel class of susceptibility gene in bacterial blight. Finally, we present partial results of transcriptomic analyses aimed at de-constructing the effects of each TAL effector from one strain on the rice transcriptome, as well as results from collaborative functional and evolutionary analyses in other groups of Xanthomonas.Altogether, this thesis offers a new conceptual framework and new tools for the analysis of TAL effector function and evolution, and we hope this will help in the design of strategies aimed at improving resistance to bacteria in agronomically important plants. Xanthomonas Évolution Effecteurs TAL Bioinformatique Riz Xanthomonas Evolution TAL effectors Bioinformatics Rice
88	Méthodes pour l'identification de domaines protéiques divergents / Functional annotation of divergent genomes : application to Leishmania parasite Ghouila, Amel 16 December 2013 (has links) L'étude de la composition des protéines en domaines est une étape clé pour la détermination de ses fonctions. Pfam est l'une des banques de domaines les plus répandues où chaque domaine est représenté par un HMM profil construit à partir d'un alignement multiple de protéines contenant le domaine. La méthode classique de recherche des domaines Pfam consiste à comparer la séquence cible à la librairie complète des HMM profils pour mesurer sa ressemblance aux différents modèles. Cependant, appliquée aux protéines d'organismes divergents, cette méthode manque de sensibilité. L'objectif de cette thèse est d'apporter de nouvelles méthodes pour améliorer le processus de prédictions des domaines plus adaptées à l'étude des protéines divergentes. Les premiers travaux ont consisté en l'adaptation et application de la méthode CODD, récemment proposée, à l'ensemble des pathogènes de la base de données EuPathDB. Une base de données nommée EupathDomains (http://www.atgc-montpellier.fr/EuPathDomains/) recensant l'ensemble des domaines connus et ceux nouvellement prédits chez ces pathogènes a été mise en place à l'issue de ces travaux. Nous nous sommes ensuite attachés à proposer diverses améliorations. Nous proposons un algorithme ''CODD_exclusive'' qui utilise des informations d'incompatibilité de domaines pour améliorer la précision des prédictions. Nous proposons également une autre stratégie basée sur l'utilisation de règles d'association pour la détermination des co-occurrences de domaines utilisées dans le processus de certification. La dernière partie de cette thèse s'intéresse à l'utilisation des méthodes profil/profil pour annoter un génome entier. Couplée à la procédure d'annotation par co-occurrence, cette approche permet une amélioration notable en termes de nombre de domaines certifiés et également en termes de précision. / The determination of protein domain composition provides strong clues for the protein function prediction. One of the most widelyused domain scheme is the Pfam database in which each family is represented by a multiple sequence alignment and a profileHidden Markov Model (profile HMM). When analyzing a new sequence, each Pfam HMM is used to compute a score measuring the similarity between the sequenceand the domain. However, applied to divergent proteins, this strategy may miss several domains. This is the case for all eukaryotic pathogens, where noPfam domains are detected in half or even more of their proteins.The main objective of this thesis is to develop methods to improve the sensitivity of Pfam domain detection in divergent proteins. We first adapted the recently proposed CODD method to the whole set of pathogens in EupathDB. A public database named EupathDomains (http://www.atgc-montpellier.fr/EuPathDomains/) gathers known and new domains detected by CODD, along with the associated confidence measurements and the GO annotations.We then proposed other methods to further improve domain detection in these organisms. We proposed ''CODD_exclusive'' algorithm that integrates domain exclusion information to prune false positive domains that are in conflict with other domains of the protein. We also suggested the use of association rules to determine the correlations between domains and used these informations in the certification process.In the last part of this thesis, we focused in the use of profile/profile methods to predict protein domains in a whole genome. Combined with the co-occurrence informations, it achieved high sensitivity and accuracy in predicting domains. Bioinformatique Annotation fonctionnelle Domaines protéiques Leishmania Plasmodium Pathogènes Bioinformatics Functional annotation Protein domains Leishmania Plasmodium Pathogens
89	Bioinformatics tools for the systems biology of dysferlin deficiency / Outils de bioinformatique pour la biologie des systèmes de la déficience en dysferline Malatras, Apostolos 13 December 2017 (has links) Le but de mon projet est de créer et d’appliquer des outils pour l’analyse de la biologie des systèmes musculaires en utilisant différentes données OMICS. Ce projet s’intéresse plus particulièrement à la dysferlinopathie due la déficience d’une protéine appelée dysferline qui est exprimée principalement dans les muscles squelettiques et cardiaque. La perte du dysferline due à la mutation (autosomique-récessive) du gène DYSF entraîne une dystrophie musculaire progressive (LGMD2B, MM, DMAT). Nous avons déjà développé des outils bio-informatiques qui peuvent être utilisés pour l’analyse fonctionnelle de données OMICS, relative à la dyspherlinopathie. Ces derniers incluent le test dit «gene set enrichment analysis», test comparant les profils OMICS d’intérêts aux données OMICS musculaires préalablement publiées ; et l’analyse des réseaux impliquant les diffèrent(e)s protéines et transcrits entre eux/elles. Ainsi, nous avons analysé des centaines de données omiques publiées provenant d’archives publiques. Les outils informatiques que nous avons développés sont CellWhere et MyoMiner. CellWhere est un outil facile à utiliser, permettant de visualiser sur un graphe interactif à la fois les interactions protéine-protéine et la localisation subcellulaire des protéines. Myominer est une base de données spécialisée dans le tissu et les cellules musculaires, et qui fournit une analyse de co-expression, aussi bien dans les tissus sains que pathologiques. Ces outils seront utilisés dans l'analyse et l'interprétation de données transcriptomiques pour les dyspherlinopathies mais également les autres pathologies neuromusculaires. / The aim of this project was to build and apply tools for the analysis of muscle omics data, with a focus on Dysferlin deficiency. This protein is expressed mainly in skeletal and cardiac muscles, and its loss due to mutation (autosomal-recessive) of the DYSF gene, results in a progressive muscular dystrophy (Limb Girdle Muscular Dystrophy type 2B (LGMD2B), Miyoshi myopathy and distal myopathy with tibialis anterior onset (DMAT)). We have developed various tools and pipelines that can be applied towards a bioinformatics functional analysis of omics data in muscular dystrophies and neuromuscular disorders. These include: tests for enrichment of gene sets derived from previously published muscle microarray data and networking analysis of functional associations between altered transcripts/proteins. To accomplish this, we analyzed hundreds of published omics data from public repositories. The tools we developed are called CellWhere and MyoMiner. CellWhere is a user-friendly tool that combines protein-protein interactions and protein subcellular localizations on an interactive graphical display (https://cellwhere-myo.rhcloud.com). MyoMiner is a muscle cell- and tissue-specific database that provides co-expression analyses in both normal and pathological tissues. Many gene co-expression databases already exist and are used broadly by researchers, but MyoMiner is the first muscle-specific tool of its kind (https://myominer-myo.rhcloud.com). These tools will be used in the analysis and interpretation of transcriptomics data from dysferlinopathic muscle and other neuromuscular conditions and will be important to understand the molecular mechanisms underlying these pathologies. Bioinformatique Dyspherlinopathie Omics Co-expression Micropuces Transcriptomiques Transcriptomics Microarrays Bioinformatics 570.15
90	Diversité, évolution et écologie virale : des communautés aux génotypes. Analyse bioinformatique de métagénomes viraux / Viral diversity, evolution and ecology : from communities to genotypes. Bioinformatic analysis of viral metagenomes Roux, Simon 03 October 2013 (has links) Les virus sont omniprésents dans la biosphère et infectent vraisemblablement l'ensemble des êtres vivants. Au sein des écosystèmes, ils ont ainsi un impact sur la diversité des populations microbiennes, l'évolution des génomes de ces populations, et directement ou indirectement sur les cycles biogéochimiques majeurs. Leur caractère protéiforme et l'absence de marqueur unique (tant génétique que physique) font toutefois de l'exploration de la diversité virale une tâche complexe, de telle sorte que nos connaissances sur ces communautés virales environnementales sont encore très limitées. La métagénomique, ou séquençage massif et aléatoire de fragments nucléotidiques extraits d'un prélèvement, offre un point de vue unique sur les génomes viraux. Ce type d'approche, récemment développé, a ainsi mis en évidence la richesse extraordinaire des populations virales environnementales, tant du point de vue des gènes que des génotypes. C'est dans ce cadre de l'étude des communautés virales de l'environnement par métagénomique que se sont inscrits les travaux de cette thèse, organisée autour de quatre axes principaux : • Le développement de nouvelles méthodes d'analyses adaptées aux spécificités des génomes et métagénomes viraux par la mise en place du serveur web Metavir, premier serveur dédié à l'analyse des viromes. Proposant aujourd'hui un ensemble cohérent d'outils pour différents types de viromes, Metavir compte plus de 300 utilisateurs pour plus de 2000 viromes analysés. • Le potentiel fonctionnel des génomes viraux a pu être approché par l'étude conjointe d'un ensemble de viromes. Après une analyse rigoureuse des contaminations potentielles, nous avons pu confirmer que les génomes viraux comprenaient un ensemble limité mais non négligeable de gènes associés au métabolisme cellulaire. La plupart des virus agissent ainsi certainement directement sur le métabolisme de la cellule hôte durant l'infection. • La prépondérance des paramètres environnementaux, et particulièrement de la salinité, en tant que facteurs structurant les communautés virales aquatiques a également pu être mise en avant. La distance géographique entre prélèvements semble n'avoir qu'une influence secondaire, confirmant la capacité importante de dispersion des capsides virales. Une adaptation locale semble toutefois exister dans certains cas, notamment en cas de compétition importante entre les résistances développées par les hôtes et les capacités d'infection des virus. • Enfin, différentes familles de petits virus à ADN simple brin ont pu être caractérisées par une méta-analyse de viromes. Leur apparente simplicité a ainsi révélé des mécanismes d'évolution plus complexes que prévus, impliquant différents cycles et capacités de transfert de gènes jusqu’ici plutôt considérés comme l'apanage des virus à ADN double brin, et remettant en cause les séparations admises entre les différents groupes de virus sur la base de la nature de leur génome. En permettant une étude depuis l'échelle de la communauté jusqu'à des génotypes spécifiques, les viromes constituent des outils de choix pour caractériser la diversité virale, appréhender les différents facteurs régulant ces communautés, et ainsi mieux comprendre la place des virus dans la biosphère. De plus, ces études ont confirmé l'existence d'interactions étroites entre virus et organismes cellulaires, ces interactions semblant nombreuses, multiples dans leurs natures et conséquences, et présentes tout au long de l'histoire du vivant. Ces nouvelles connaissances apportées par l'analyse de viromes permettent donc d'aborder certaines questions fondamentales concernant l'origine des grandes innovations évolutives ou le fonctionnement global des écosystèmes. / Viruses likely infect every organism on Earth (in some cases even other viruses!), and represent vast morphological and genetic diversity. Not surprisingly given their numerical dominance, viruses significantly impact ecosystems through regulating microbial populations, driving major biogeochemical cycles, and shaping the evolution of hosts genomes. However, our understanding of viruses in nature is primitive, especially because the majority of environmental viral genomes remains uncharacterized. Metagenomics (i.e. random and massive sequencing of genomic fragments isolated from a sample) applied to encapsidated genetic templates provides a unique perspective on the viral pangenome. The first viral metagenomes (or viromes) generated entire sets of new questions about viral diversity, especially concerning their genetic and species richness. This work was set within this frame of viral diversity study through metagenomics, and organized into four main themes : • The development of bioinformatics tools adapted to the specific features of viral genomes and metagenomes led to the release of Metavir, the first web server dedicated to virome analysis. Providing a comprehensive set of connected tools, Metavir has now been used by more than 300 users in the analysis of more than 2000 viromes. • The functions encoded within viral genomes were for the first time thoroughly examined, following a rigorous examination of a set of published viromes toward contamination by cellular DNA. A new picture of the viral functional potential could thus be drawn, which confirmed that the range of cellular functions encoded in viral genomes is wider than the one retrieved from the complete genomes currently available, though not as great as previously estimated. • The study of the aquatic viral metagenomes also revealed the importance of salinity in the distribution of viral communities across the globe. The ubiquitous distribution of most viral genotypes confirmed that viral particles seem to be able to move across any distance on Earth. Viruses are thus likely selected based on factors such as the presence of their host in the samples and the competition with other parasites, which can still drive local adaptations. • Finally, viromes were used to better characterize the diversity of different ssDNA viral families. Despite their small size and relative simplicity, these viruses were found to harbor unexpectedly complex cycles and evolutionary mechanisms, in particular a great potential of recombination and gene transfer. Overall, the new genomes assembled from viromes notably challenge the separation between viruses based on the nature of their genome. Eventually, as illustrated by these different works and analyses, viromes are unique and extremely powerful tool to assess and characterize viral genetic diversity. Moreover, considering the tight links between viral and cellular worlds, insights into the viral communities provided by metagenomics make it possible to address fundamental questions such as the origin of important evolutive innovations or the functioning of ecosystems, so that these results are of interest for the whole field of biology. Virus Métagénomique Bioinformatique Écologie Génomique Évolution Virus Metagenomics Bioinformatics Ecology Genomic Evolution

Search results