• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 207
  • 104
  • 32
  • Tagged with
  • 317
  • 153
  • 62
  • 60
  • 59
  • 58
  • 47
  • 39
  • 37
  • 35
  • 29
  • 25
  • 23
  • 21
  • 21
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Analyse bioinformatique du transcriptome des champignons mycorhiziens Tuber melanosporum et Glomus intraradices / Bioinformatic analysis of the transcriptome of mycorrhizal fungi Tuber melanosporum and Glomus intraradices

Tisserant, Emilie 15 December 2011 (has links)
La symbiose mycorhizienne est une interaction mutualiste formée entre les racines des plantes terrestres et des champignons du sol. Les changements morphoanatomiques associés au développement de cette symbiose sont accompagnés de modifications dans la régulation de l'expression génique. L'étude des profils transcriptomiques est donc fondamentale afin de caractériser les mécanismes moléculaires gouvernant la symbiose mycorhizienne. Le développement récent des approches de transcriptomique à haut débit offre de nouvelles perspectives pour la compréhension de ces mécanismes. Le travail entrepris dans le cadre de ce projet de thèse visait à caractériser in silico le transcriptome symbiotique du champignon ectomycorhizien Tuber melanosporum et du champignon endomycorhizien Glomus intraradices. Il s'agissait de mettre en place les outils et les protocoles bioinformatiques permettant l'exploitation des données transcriptomiques issues des nouvelles technologies de séquençage, afin de caractériser les transcrits exprimés par les symbiotes et d'identifier les gènes régulés au cours de la symbiose. Ce travail original a permis de souligner l'existence de traits communs aux profils d'expression des champignons mycorhiziens. De plus, la caractérisation du transcriptome de G. intraradices a permis d'établir le premier répertoire de gènes à l'échelle du génome pour un champignon endomycorhizien. Cette étude de génomique contribue à l'amélioration des connaissances sur les processus moléculaires qui sous-tendent la symbiose mycorhizienne et constitue une ressource unique pour de futures recherches sur les réseaux de gènes contrôlant la symbiose / Mycorrhizal symbiosis is a mutualistic interaction involving roots of terrestrial plants and soil fungi. Morphological changes associated with the development of this symbiosis are accompanied by changes in gene expression. The study of transcriptomic profiles is thus essential to characterize the molecular mechanisms that govern the mycorrhizal symbiosis. The recent development of high-throughput transcriptomic approaches provides new insights for the understanding of these mechanisms. The work undertaken during this thesis aimed to characterize in silico the transcriptome of the ectomycorrhizal fungus Tuber melanosporum and the endomycorrhizal fungus Glomus intraradices. In order to characterize transcripts expressed by the symbionts and to identify genes regulated during symbiosis, bioinformatic tools and protocols were implemented to process transcriptomic data derived from new sequencing technologies. This work has allowed to highlight common features in the expression profiles of mycorrhizal fungi. In addition, characterization of the G. intraradices transcriptome has allowed to establish the first genome-wide repertoire of genes for an endomycorrhizal fungus. The study helps to improve knowledge about the molecular processes underlying the mycorrhizal symbiosis and provides a unique resource for future research on the gene networks controlling symbiosis
82

Décompositions et Visualisations de graphes : applications aux données biologiques

Bourqui, Romain 24 October 2008 (has links)
La quantité d’informations stockée dans les bases de données est en constante augmentation rendant ainsi nécessaire la mise au point de systémes d’analyse et de visualisation. Nous nous intéressons dans cette thèse aux données relationnelles et plus particulièrement aux données biologiques. Cette thèse s’oriente autour de trois axes principaux : tout d’abord, la décomposition de graphes en groupes d’éléments ”similaires” a?n de détecter d’éventuelles structures de communauté ; le deuxième aspect consiste à mettre en évidence ces structures dans un système de visualisation, et dans un dernier temps, nous nous intéressons à l’utilisabilité de l’un de ces systèmes de visualisation via une évaluation expérimentale. Les travaux de cette thèse ont été appliqués sur des données réelles provenant de deux domaines de la biologie : les réseaux métaboliques et les réseaux d’interactions génes- protéines. / The amount of information stored in databases is constantly increasing making necessary to develop systems for analysis and visualization. In this thesis, we are interested in relational data and in particular, in biological data. This thesis focuses on three main axes : ?rstly, the decomposition of graph into clusters of ”similar” elements in order to detect the community structures ; the second aspect is to highlight these structures in a visualization system; and thirdly, we are interested in the usability of one of these visualization systems through an experimental evaluation. The work presented in this thesis was applied on real data from two ?elds of biology : the metabolic networks and the gene-protein interaction networks.
83

Découverte d'éléments cis-régulateurs impliqués dans l'activation transcriptionnelle du génome zygotique dans l'embryon précoce de Drosophila melanogaster

Darbo, Elodie 16 December 2011 (has links)
Chez les métazoaires, la transcription est inactive durant les étapes précoces du développement embryonnaire. Chez Drosophila melanogaster, des études récentes de l'activation du génome zygotique (AGZ) ont mis en évidence l'implication de quelques acteurs moléculaires (Zelda, STAT92E), mais les mécanismes régulateurs généraux restent à découvrir. En appliquant des méthodes bioinformatiques à l'analyse de données à haut débit de différentes sources, j'ai recherché de nouveaux éléments cis-régulateurs impliqués dans l'AGZ. Tout d'abord, par l'analyse de données transcriptomiques, j'ai sélectionné un groupe de gènes activés pendant l'AGZ. L'analyse de leurs régions non codantes a mis en évidence neuf motifs, dont trois correspondent à des motifs connus (Zelda, Trl et facteur TTK). La recherche systématique de ces motifs m'a permis de prédire des modules cis-régulateurs (CRMs) potentiels pour lesquels j'ai défini un environnement chromatinien spécifique en analysant des profils d'occupation de (co-) facteurs de transcription pertinents et d'histones modifiées (ChIP-seq) ainsi que des profils d'ouverture de la chromatine. L'ensemble de ces résultats m'a permis de définir un modèle de régulation de l'AGZ et de sélectionner des régions candidates pour une validation expérimentale. / In metazoa, transcription is silent during early embryogenesis. In Drosophila melanogaster, recent studies of the zygotic genome activation (ZGA) highlighted the implication of few molecular actors (Zelda, STAT92E), but general regulatory mechanisms remains to be understood. Applying bioinformatics analyses on different type of high-throughput data, I searched for new cis-regulatory elements involved in ZGA.First, through analysis of transcriptome data, I selected a group of genes activated during ZGA. Analysis of their non-coding sequences highlighted nine motifs, of which three correspond to known binding motifs and factors (Zelda, Trl and TTK). Systematic research of these motifs led to the prediction of putative cis-regulatory modules (CRMs) for which I defined a specific chromatin environment analyzing occupancy profiles of relevant transcription (co-) factors and modified histones, as well as profiles of chromatin opening. Altogether, these results allowed me to define a regulatory model of the ZGA and select candidate regions for further experimental validation.
84

Synaptic plasticity emerging from chemical reactions : Modeling spike-timing dependent plasticity of basal ganglia neurons / Emergence de la plasticité synaptique à partir des réactions biochimiques : Modélisation de la plasticité dépendante du timing du potentiel d'action (STDP) des neurones des ganglions de la base

Prokin, Ilia 02 December 2016 (has links)
Notre cerveau prend en charge différentes formes d’apprentissage dans ses diverses parties. C’est par exemple le cas des ganglions de la base, un ensemble de noyaux sous-corticaux qui est impliqué dans la sélection de l’action et une forme spécifique de l’apprentissage / mémoire, la mémoire procédurale (mémoire des compétences ou d’expertise). A l’échelle du neurone unique, le support le plus plausible de l’apprentissage et de la mémoire est la plasticité synaptique, le processus par lequel l’efficacité de la communication entre deux neurones change en réponse à un pattern spécifique de conditions environnementales. Parmi les différentes formes de plasticité synaptique, la plasticité dépendante du timing des spikes (STDP) représente le fait que le poids synaptique (l’efficacité de la connexion) change en fonction du temps écoulé entre l’émission des deux potentiels d’action (spikes) présynaptiques et postsynaptiques consécutifs. Si la STDP est une forme de plasticité qui a récemment attiré beaucoup d’intérêt, on ne comprend pas encore comment elle émerge des voies de signalisation / biochimiques qui la sous-tendent. Pour répondre à cette question, nous combinons les approches expérimentales de nos collaborateurs (pharmacologie et électrophysiologie) avec la modélisation de la dynamique des réseaux de signalisation impliquées (décrite par des équations différentielles ordinaires). Après estimation des paramètres, le modèle reproduit la quasi-totalité des données expérimentales, y compris la dépendance de la STDP envers le nombre stimulations pré- et post-synaptiques appariées et son exploration pharmacologique intensive (perturbation des voies de signalisation par des produits chimiques). En outre, contrairement à ce qui était largement admis dans la communauté des neurosciences, notre modèle indique directement que le système endocannabinoïde contrôle les changements du poids synaptique de façon bi-directionnelle (augmentation et diminution). De plus, nous étudions comment une série de facteurs comme la recapture du glutamate régule la STDP. Notre modèle représente une première étape pour l’élucidation de la régulation de l’apprentissage et de la mémoire au niveau du neurone unique dans les ganglions de la base. / Our brains support various forms of learning in their various subparts. This is for instance the case of the basal ganglia, a set of subcortical nuclei that is involved in action selection and a specific form of learning / memory, procedural memory (memory of skills or expertise). At the scale of single neurons, the most plausible support of learning and memory is synaptic plasticity, the process by which the efficiency of interneuronal communication changes in response to a pattern of environmental conditions. A recent focus of research is on spike-timing dependent plasticity (STDP), whereby the relative timing of activations (spikes) of connected pre- and postsynaptic neurons, determines the synaptic weight (the efficiency of synaptic connection). Notwithstanding, the dependence of STDP on underlying signaling pathways is not yet fully understood. To address this issue, we combine experimental approaches by our collaborators (pharmacology and electrophysiology) with modeling of the implicated signaling network (described by Ordinary-Differential Equations). After parameter estimation, the model reproduces much of experimental data, including the dependence of STDP on the number of paired stimuli of pre- and postsynaptic neurons and intensive pharmacological exploration (where signaling molecules are perturbed by chemicals). Furthermore, in opposition to what was widely believed in the neuroscience community, our model directly indicates that the endocannabinoid system supports bidirectional changes of the synaptic weight (increase and decrease). Moreover, we study how a range of factors including glutamate uptake regulates STDP. We expect our model to be a starting point to the elucidation of the regulation of learning and memory in the basal-ganglia at the single neuron level.
85

Lien entre les réarrangements chromosomiques et la structure de la chromatine chez la Drosophile / Linking large scale genome rearrangement to chromatin structure in Drosophila

Pulicani, Sylvain 28 November 2018 (has links)
Entre espèces, les génomes présentent des différences dans leur organisation, que ce soit au niveau du caryotype ou de l'ordre des gènes. Ceci reste vrai même entre espèces relativement proches comme l'humain et la souris, et est du aux réarrangements chromosomiques. Reconstruire l'histoire évolutive d'une lignée revient donc à déterminer des scénarios de réarrangements qui transforment un génome actuel en un autre. Le génome ancestral se trouve alors être l'un des états intermédiaires atteint par l'un de ces scénarios.Les réarrangements chromosomiques sont des évènements biologiques violents pour la cellule. En effet, de nombreux mécanismes moléculaires ont pour fonction de stopper le cycle cellulaire dans le cas où le génome aurait été altéré. De plus, les réarrangements peuvent être à l'origine de phénotypes aberrants, et donc probablement désavantageux pour leur porteur. Au vu de tout cela, il paraît raisonnable de poser l'hypothèse selon laquelle les scénarios de réarrangements sont parcimonieux.Cependant, il est admis que ce seul critère ne permet pas de reconstruire efficacement l'histoire évolutive des génomes. En effet, quelque soit le modèle utilisé pour générer les scénarios, leur nombre est exponentiel en le nombre de réarrangements. Une autre contrainte biologique doit donc être ajoutée. La conservation de la structure spatiale de la chromatine pourrait être un critère manquant essentiel. Il a été montré in vitro que lors d'une cassure double-brin suivie d'une réparation non-homologue, le brin utilisé pour la réparation se situe spatialement proche de la cassure. Notre hypothèse est donc que les points de cassures qui sont proches en 3D ont plus probablement participé à des réarrangements que les autres. Cela est appuyé par des analyses génomiques sur des cellules somatiques et entre espèces. Nommons cette hypothèse: l'hypothèse de localité.Notre approche a été de proposer une méthode pour utiliser l'information structurale afin de prioriser les scénarios de réarrangements. Les données de Hi-C ont été l'information structurale qui nous a permis d'appliquer la méthode aux scénarios entre D. melanogaster et D. yakuba.Ces résultats nous ont ensuite menés à nous demander si la structure de la chromatine ne pouvait pas elle-même évoluer. Elle serait alors susceptible d'être considérée comme un caractère phylogénétique. Cette idée est appuyée par d'autres résultats montrant la conservation de domaines topologiques entre espèces.Cette question ne semble pas avoir été posée auparavant. Elle est pourtant très intéressante car elle permet d'ouvrir tout un champ d'étude. En effet, si la structure de la chromatine porte un signal phylogénétique, alors il devient possible de s'interroger sur les mécanismes en œuvre lors de la sélection, ou sur la possibilité de reconstruire l'état ancestral de cette structure. Par la suite, il serait même possible de comparer l'évolution de la séquence et celle de la structure de la chromatine.Nous avons ainsi défini une distance entre les structures des génomes, basée sur la comparaison des contacts entre loci orthologues. Nous l'avons appliquée à une ensemble de six espèces comprenant l'humain, la souris et quatre drosophiles. Ces résultats confirment la présence d'un signal phylogénétique dans la structure spatiale des génomes. Ils mettent également en lumière l'intérêt de la mise en place de méthodes permettant de comparer efficacement des données de contacts entre espèces. / Different species have different genome organization. Whether it be the karyotype or gene order, these differences are seen even with relatively close species like Human and Mouse. This is caused by the chromosomal rearrangement. Infererence of rearrangement scenarios that transform one present-day species into another can give insight into evolutionary states, the ancestral genome being one of the intermediates of the true scenario.The chromosomal rearrangements are violent biological events for the cell. Indeed, numerous mechanisms are present to stop the cell cycle when the genome sequence is altered. Moreover, rearrangements can be the source of aberrant phenotypes, which are probably unfavorable for the carrier. With all that, it seams reasonable to assume the rearrangement scenarios are parsimonious.However, it is accepted that this criterion alone is not sufficient to efficiently build the evolutionary history of the genomes. Indeed, for whatever model we choose, the number of scenario is exponential in the number of rearrangements. Another biological constraint is needed. The spatial structure of the chromatin could be an essential missing criterion. It has been shown in vitro that when a double-stranded break of the DNA is non-homologously repaired, the strand used for repairing is close in space to the breakpoint. Our hypothesis is that the closer the breakpoints are in space, the more probable they are to participate in a rearrangement. This hold on genomics analysis of somatic cells, and between species. Let's name that hypothesis the locality hypothesis.We proposed a method to use the structural information in order to prioritize the rearrangements scenarios. The Hi-C data were the structural information that allowed us to apply our method to scenarios between D. melanogaster and D. yakuba.This results led us to ask whether the chromatin structure could evolve by itself. Then, it could be used as a phylogenetic mark. This idea is related to previous results showing the conservation of topological domains between species.This question seams to be new, and could open a new line of investigation. If the chromatin structure holds a phylogenetical signal, it becomes possible to ask ourselves about the mechanisms that occur during the selection, or if it is possible for the ancestral state to be inferred. Then, it could even be possible to compare the evolution of the sequence with the one of the chromatin structure.Thus, we defined a distance between genome structures, based on the comparison of contacts between orthologous loci. We applied this distance to a set of six species, including the Human, the Mouse and four Drosophila. This result confirms the presence of a phylogenetic signal in the spatial structure of the genomes. They also showed that we're in need for efficient methods to compare contacts data between species.
86

Bioinformatic approaches to the study of TAL effector evolution and function / Étude de l’évolution et de la fonction des effecteurs TAL par des approches bioinformatiques

Perez Quintero, Alvaro Luis 21 April 2017 (has links)
Les effecteurs TAL (« Transcription Activator-Like ») sont des protéines présentes majoritairement chez les bactéries phytopathogènes du genre Xanthomonas. Ces protéines bactériennes sont dirigées vers le noyau des cellules de la plante hôte où elles induisent l’expression de gènes. L’induction de gènes de « susceptibilité » de la plante est responsable de la maladie. Les effecteurs TAL sont capables de se lier à l’ADN grâce à un motif particulier consistant en une série de répétitions quasi-identiques s’enroulant autour de l’ADN et formant une super-hélice. Au sein des répétitions deux acides aminés localisés à l’intérieur de chaque boucle de la super-hélice interagissent directement et spécifiquement avec les nucléotides. Des combinaisons différentes de ces deux acides aminés se lient spécifiquement à certains nucléotides, selon un code unique.Une conséquence de cette interaction étroite est que les plantes et les bactéries co-évoluent selon une course aux armements où le génome de la plante se diversifie pour éviter d’être la cible des effecteurs TAL, tandis que les gènes tal se diversifient pour s’adapter à de nouvelles cibles. Les aspects évolutifs des effecteurs TAL sont encore largement inconnus, notamment comment la spécificité évolue vers de nouvelles cibles végétales. Cette thèse présente les premiers travaux sur la compréhension des mécanismes évolutifs des gènes tal, principalement abordés par la bioinformatique. Nous avons développé la suite de programmes « QueTAL » qui permet d’une part la construction d’arbres phylogénétiques basés soit sur la séquence des répétitions, soit sur la séquence des sites cibles, d’autre part la recherche de motifs de répétitions pouvant constituer les unités évolutives des effecteurs TAL. Cette suite bioinformatique est publique, en ligne, et activement utilisée par la communauté des scientifiques travaillant sur les effecteurs TAL des Xanthomonas.Ces programmes ont été appliqués (ainsi que d’autres approches) à plus de 900 séquences d’effecteurs TAL de 22 groupes bactériens. Nous avons mis en évidence i) une perte de diversité dans les répétitions chez les Xanthomonas, qui aurait des conséquence sur l’évolution de la structure des effecteurs TAL; ii) l’existence de groupes fonctionnels de gènes tal spécifiques à certains pathovars ; iii) un probable mécanisme évolutif reposant sur la recombinaison (principalement par conversion génique), révélé par le gain ou la perte de répétitions en blocs entiers. Notre hypothèse est que le moteur de la spécialisation des effecteurs TAL est la recombinaison de ces blocs entre gènes conduisant à une diversification fonctionnelle rapide vers de nouvelles cibles végétales.Nous avons ensuite analysé plus en détail la diversité des séquences TAL de souches africaines de Xanthomonas oryzae pv. oryzae (Xoo), agent de la bactériose vasculaire, maladie bactérienne la plus importante du riz. Nous avons montré qu’un gène tal résultant d’une conversion génique pouvait être fonctionnel, indiquant que ce mécanisme peut être un moteur évolutif chez les effecteurs TAL. Les données de transcriptomique et de gain de fonction ont permis de mettre en évidence un effecteurs TAL dont la virulence s’exerce par l’activation de deux gènes de susceptibilité, dont l’un n’avait jamais été décrit chez Xoo. Enfin nous présentons des résultats préliminaires sur les effets d’une déconstruction de TALome sur le transcriptome de riz ainsi que des travaux fonctionnels et évolutifs issus de collaborations sur d’autres Xanthomonas.Cette thèse offre un nouveau cadre conceptuel ainsi que de nouveaux outils pour l’analyse fonctionnelle et évolutive des effecteurs TAL qui devraient améliorer la mise au point de stratégies pour la résistance des plantes aux Xanthomonas. / Transcription activator-like (TAL) effectors are proteins found mainly in the genus of Xanthomonas phytopathogenic bacteria. These proteins enter the nucleus of cells in the host plant and can induce the expression of genes. The induction of “susceptibility” S genes in the plant will result in disease. TAL effectors are able to bind DNA thanks to a unique motif consisting of a series of nearly-identical repeats that wrap around the DNA forming a super-helix, in each repeat two amino-acids found in a loop on the inner side of the helix directly interact with nucleotides. Different combination of amino-acids in this loop bind specific nucleotides following a unique code.A consequence of this tight interaction is that plants and bacteria co-evolve following an arms race where the plant genome diversifies to avoid being targeted by the TAL effectors, while tal effector genes diversify to adapt to new targets.Various aspects of TAL effector evolution are still unknown, specially how does specificity arise towards certain targets in the host plant? As first steps towards answering this question, in these thesis we show the results of using primarily bioinformatic strategies to find evolutionary patterns in TAL effector sequences. We designed the suite “QueTAL” containing software for 1) the construction of phylogenetic trees based on repeat sequences, 2) comparison of predicted binding sites for TAL effectors, 3) identification of repeat motifs in TAL effector pairs. This suite was made publicly available and it is being actively used by the Xanthomonas research community.We used these programs along with other strategies to analyze variation in over 900 TAL effector sequences from 22 taxonomic groups finding 1) a loss of diversity of repeats through the Xanthomonas genus, which may impact the evolution of TAL effector architecture, 2) groups of TAL effector orthologs specific to certain taxonomic groups of pathovars that may share common functions, 3) evidence of repeat motifs shared and lost between TAL effectors hinting at extensive recombination (particularly gene conversion) events. We propose that the swapping of repeat blocks between TAL effectors is a motor for TAL effector specialization that allows for fast functional diversification through the acquisition of new targets in the host plants.We then analyzed in detail the diversity of TAL effector sequences in African strains of Xanthomonas oryzae pv. oryzae (Xoo), causing agent of bacterial leaf blight of rice, the most destructive bacterial disease in rice. We found indications of virulence activity of a TAL effector being the product of a gene conversion event, supporting our hypothesis of gene conversion as a motor of TAL effector evolution. We also used transcriptomic data and systematic gain-of-function assays to uncover a TAL effector that exerts a virulence role through the induction of two susceptibility genes, one of which represents a novel class of susceptibility gene in bacterial blight. Finally, we present partial results of transcriptomic analyses aimed at de-constructing the effects of each TAL effector from one strain on the rice transcriptome, as well as results from collaborative functional and evolutionary analyses in other groups of Xanthomonas.Altogether, this thesis offers a new conceptual framework and new tools for the analysis of TAL effector function and evolution, and we hope this will help in the design of strategies aimed at improving resistance to bacteria in agronomically important plants.
87

Méthodes pour l'identification de domaines protéiques divergents / Functional annotation of divergent genomes : application to Leishmania parasite

Ghouila, Amel 16 December 2013 (has links)
L'étude de la composition des protéines en domaines est une étape clé pour la détermination de ses fonctions. Pfam est l'une des banques de domaines les plus répandues où chaque domaine est représenté par un HMM profil construit à partir d'un alignement multiple de protéines contenant le domaine. La méthode classique de recherche des domaines Pfam consiste à comparer la séquence cible à la librairie complète des HMM profils pour mesurer sa ressemblance aux différents modèles. Cependant, appliquée aux protéines d'organismes divergents, cette méthode manque de sensibilité. L'objectif de cette thèse est d'apporter de nouvelles méthodes pour améliorer le processus de prédictions des domaines plus adaptées à l'étude des protéines divergentes. Les premiers travaux ont consisté en l'adaptation et application de la méthode CODD, récemment proposée, à l'ensemble des pathogènes de la base de données EuPathDB. Une base de données nommée EupathDomains (http://www.atgc-montpellier.fr/EuPathDomains/) recensant l'ensemble des domaines connus et ceux nouvellement prédits chez ces pathogènes a été mise en place à l'issue de ces travaux. Nous nous sommes ensuite attachés à proposer diverses améliorations. Nous proposons un algorithme ''CODD_exclusive'' qui utilise des informations d'incompatibilité de domaines pour améliorer la précision des prédictions. Nous proposons également une autre stratégie basée sur l'utilisation de règles d'association pour la détermination des co-occurrences de domaines utilisées dans le processus de certification. La dernière partie de cette thèse s'intéresse à l'utilisation des méthodes profil/profil pour annoter un génome entier. Couplée à la procédure d'annotation par co-occurrence, cette approche permet une amélioration notable en termes de nombre de domaines certifiés et également en termes de précision. / The determination of protein domain composition provides strong clues for the protein function prediction. One of the most widelyused domain scheme is the Pfam database in which each family is represented by a multiple sequence alignment and a profileHidden Markov Model (profile HMM). When analyzing a new sequence, each Pfam HMM is used to compute a score measuring the similarity between the sequenceand the domain. However, applied to divergent proteins, this strategy may miss several domains. This is the case for all eukaryotic pathogens, where noPfam domains are detected in half or even more of their proteins.The main objective of this thesis is to develop methods to improve the sensitivity of Pfam domain detection in divergent proteins. We first adapted the recently proposed CODD method to the whole set of pathogens in EupathDB. A public database named EupathDomains (http://www.atgc-montpellier.fr/EuPathDomains/) gathers known and new domains detected by CODD, along with the associated confidence measurements and the GO annotations.We then proposed other methods to further improve domain detection in these organisms. We proposed ''CODD_exclusive'' algorithm that integrates domain exclusion information to prune false positive domains that are in conflict with other domains of the protein. We also suggested the use of association rules to determine the correlations between domains and used these informations in the certification process.In the last part of this thesis, we focused in the use of profile/profile methods to predict protein domains in a whole genome. Combined with the co-occurrence informations, it achieved high sensitivity and accuracy in predicting domains.
88

Bioinformatics tools for the systems biology of dysferlin deficiency / Outils de bioinformatique pour la biologie des systèmes de la déficience en dysferline

Malatras, Apostolos 13 December 2017 (has links)
Le but de mon projet est de créer et d’appliquer des outils pour l’analyse de la biologie des systèmes musculaires en utilisant différentes données OMICS. Ce projet s’intéresse plus particulièrement à la dysferlinopathie due la déficience d’une protéine appelée dysferline qui est exprimée principalement dans les muscles squelettiques et cardiaque. La perte du dysferline due à la mutation (autosomique-récessive) du gène DYSF entraîne une dystrophie musculaire progressive (LGMD2B, MM, DMAT). Nous avons déjà développé des outils bio-informatiques qui peuvent être utilisés pour l’analyse fonctionnelle de données OMICS, relative à la dyspherlinopathie. Ces derniers incluent le test dit «gene set enrichment analysis», test comparant les profils OMICS d’intérêts aux données OMICS musculaires préalablement publiées ; et l’analyse des réseaux impliquant les diffèrent(e)s protéines et transcrits entre eux/elles. Ainsi, nous avons analysé des centaines de données omiques publiées provenant d’archives publiques. Les outils informatiques que nous avons développés sont CellWhere et MyoMiner. CellWhere est un outil facile à utiliser, permettant de visualiser sur un graphe interactif à la fois les interactions protéine-protéine et la localisation subcellulaire des protéines. Myominer est une base de données spécialisée dans le tissu et les cellules musculaires, et qui fournit une analyse de co-expression, aussi bien dans les tissus sains que pathologiques. Ces outils seront utilisés dans l'analyse et l'interprétation de données transcriptomiques pour les dyspherlinopathies mais également les autres pathologies neuromusculaires. / The aim of this project was to build and apply tools for the analysis of muscle omics data, with a focus on Dysferlin deficiency. This protein is expressed mainly in skeletal and cardiac muscles, and its loss due to mutation (autosomal-recessive) of the DYSF gene, results in a progressive muscular dystrophy (Limb Girdle Muscular Dystrophy type 2B (LGMD2B), Miyoshi myopathy and distal myopathy with tibialis anterior onset (DMAT)). We have developed various tools and pipelines that can be applied towards a bioinformatics functional analysis of omics data in muscular dystrophies and neuromuscular disorders. These include: tests for enrichment of gene sets derived from previously published muscle microarray data and networking analysis of functional associations between altered transcripts/proteins. To accomplish this, we analyzed hundreds of published omics data from public repositories. The tools we developed are called CellWhere and MyoMiner. CellWhere is a user-friendly tool that combines protein-protein interactions and protein subcellular localizations on an interactive graphical display (https://cellwhere-myo.rhcloud.com). MyoMiner is a muscle cell- and tissue-specific database that provides co-expression analyses in both normal and pathological tissues. Many gene co-expression databases already exist and are used broadly by researchers, but MyoMiner is the first muscle-specific tool of its kind (https://myominer-myo.rhcloud.com). These tools will be used in the analysis and interpretation of transcriptomics data from dysferlinopathic muscle and other neuromuscular conditions and will be important to understand the molecular mechanisms underlying these pathologies.
89

Diversité, évolution et écologie virale : des communautés aux génotypes. Analyse bioinformatique de métagénomes viraux / Viral diversity, evolution and ecology : from communities to genotypes. Bioinformatic analysis of viral metagenomes

Roux, Simon 03 October 2013 (has links)
Les virus sont omniprésents dans la biosphère et infectent vraisemblablement l'ensemble des êtres vivants. Au sein des écosystèmes, ils ont ainsi un impact sur la diversité des populations microbiennes, l'évolution des génomes de ces populations, et directement ou indirectement sur les cycles biogéochimiques majeurs. Leur caractère protéiforme et l'absence de marqueur unique (tant génétique que physique) font toutefois de l'exploration de la diversité virale une tâche complexe, de telle sorte que nos connaissances sur ces communautés virales environnementales sont encore très limitées. La métagénomique, ou séquençage massif et aléatoire de fragments nucléotidiques extraits d'un prélèvement, offre un point de vue unique sur les génomes viraux. Ce type d'approche, récemment développé, a ainsi mis en évidence la richesse extraordinaire des populations virales environnementales, tant du point de vue des gènes que des génotypes. C'est dans ce cadre de l'étude des communautés virales de l'environnement par métagénomique que se sont inscrits les travaux de cette thèse, organisée autour de quatre axes principaux : • Le développement de nouvelles méthodes d'analyses adaptées aux spécificités des génomes et métagénomes viraux par la mise en place du serveur web Metavir, premier serveur dédié à l'analyse des viromes. Proposant aujourd'hui un ensemble cohérent d'outils pour différents types de viromes, Metavir compte plus de 300 utilisateurs pour plus de 2000 viromes analysés. • Le potentiel fonctionnel des génomes viraux a pu être approché par l'étude conjointe d'un ensemble de viromes. Après une analyse rigoureuse des contaminations potentielles, nous avons pu confirmer que les génomes viraux comprenaient un ensemble limité mais non négligeable de gènes associés au métabolisme cellulaire. La plupart des virus agissent ainsi certainement directement sur le métabolisme de la cellule hôte durant l'infection. • La prépondérance des paramètres environnementaux, et particulièrement de la salinité, en tant que facteurs structurant les communautés virales aquatiques a également pu être mise en avant. La distance géographique entre prélèvements semble n'avoir qu'une influence secondaire, confirmant la capacité importante de dispersion des capsides virales. Une adaptation locale semble toutefois exister dans certains cas, notamment en cas de compétition importante entre les résistances développées par les hôtes et les capacités d'infection des virus. • Enfin, différentes familles de petits virus à ADN simple brin ont pu être caractérisées par une méta-analyse de viromes. Leur apparente simplicité a ainsi révélé des mécanismes d'évolution plus complexes que prévus, impliquant différents cycles et capacités de transfert de gènes jusqu’ici plutôt considérés comme l'apanage des virus à ADN double brin, et remettant en cause les séparations admises entre les différents groupes de virus sur la base de la nature de leur génome. En permettant une étude depuis l'échelle de la communauté jusqu'à des génotypes spécifiques, les viromes constituent des outils de choix pour caractériser la diversité virale, appréhender les différents facteurs régulant ces communautés, et ainsi mieux comprendre la place des virus dans la biosphère. De plus, ces études ont confirmé l'existence d'interactions étroites entre virus et organismes cellulaires, ces interactions semblant nombreuses, multiples dans leurs natures et conséquences, et présentes tout au long de l'histoire du vivant. Ces nouvelles connaissances apportées par l'analyse de viromes permettent donc d'aborder certaines questions fondamentales concernant l'origine des grandes innovations évolutives ou le fonctionnement global des écosystèmes. / Viruses likely infect every organism on Earth (in some cases even other viruses!), and represent vast morphological and genetic diversity. Not surprisingly given their numerical dominance, viruses significantly impact ecosystems through regulating microbial populations, driving major biogeochemical cycles, and shaping the evolution of hosts genomes. However, our understanding of viruses in nature is primitive, especially because the majority of environmental viral genomes remains uncharacterized. Metagenomics (i.e. random and massive sequencing of genomic fragments isolated from a sample) applied to encapsidated genetic templates provides a unique perspective on the viral pangenome. The first viral metagenomes (or viromes) generated entire sets of new questions about viral diversity, especially concerning their genetic and species richness. This work was set within this frame of viral diversity study through metagenomics, and organized into four main themes : • The development of bioinformatics tools adapted to the specific features of viral genomes and metagenomes led to the release of Metavir, the first web server dedicated to virome analysis. Providing a comprehensive set of connected tools, Metavir has now been used by more than 300 users in the analysis of more than 2000 viromes. • The functions encoded within viral genomes were for the first time thoroughly examined, following a rigorous examination of a set of published viromes toward contamination by cellular DNA. A new picture of the viral functional potential could thus be drawn, which confirmed that the range of cellular functions encoded in viral genomes is wider than the one retrieved from the complete genomes currently available, though not as great as previously estimated. • The study of the aquatic viral metagenomes also revealed the importance of salinity in the distribution of viral communities across the globe. The ubiquitous distribution of most viral genotypes confirmed that viral particles seem to be able to move across any distance on Earth. Viruses are thus likely selected based on factors such as the presence of their host in the samples and the competition with other parasites, which can still drive local adaptations. • Finally, viromes were used to better characterize the diversity of different ssDNA viral families. Despite their small size and relative simplicity, these viruses were found to harbor unexpectedly complex cycles and evolutionary mechanisms, in particular a great potential of recombination and gene transfer. Overall, the new genomes assembled from viromes notably challenge the separation between viruses based on the nature of their genome. Eventually, as illustrated by these different works and analyses, viromes are unique and extremely powerful tool to assess and characterize viral genetic diversity. Moreover, considering the tight links between viral and cellular worlds, insights into the viral communities provided by metagenomics make it possible to address fundamental questions such as the origin of important evolutive innovations or the functioning of ecosystems, so that these results are of interest for the whole field of biology.
90

Etude du cluster oncogénique miR17-92 dans les lymphomes B agressifs humains / miR17-92a oncogenic cluster study in aggressive lymphomas

Gapihan, Guillaume 24 November 2016 (has links)
Les lymphomes à grandes cellules B primitifs du médiastin (PMBL) partagent des caractéristiques pathologiques avec les lymphomes diffus à grandes cellules B (DLBCL), et des caractéristiques moléculaires communes aux lymphomes de Hodgkin classiques (cHL). Le cluster oncogénique miR-17-92, localisé au niveau du chromosome 13q31, est un gène amplifié dans les DLBCL. Dans notre étude, nous avons comparé le niveau d’expression de chaque membre du clustermiR-17-92 dans une série de prélèvements de patients de 40 PMBL, 20 DLBCL et 20 cHL, et étudié les gènes cibles liés aux microARN dérégulés dans les PMBL. Nous avons montré un niveau plus élevé de miR-92a dans les PMBL que dans les DLBCL, mais pas dans les cHL. La combinaison d’une analyse in silico prédictive des cibles de miR-92a et d’une analyse transcriptomique nous a permis d’identifier FOXP1 comme la cible principale de miR-92a dans les PMBL, un résultats qui n’avait jusqu’alors pas été établi. Cette observation a été confirmée par le test 3’UTR, le niveau d’expression ARN et protéique dans les lignées cellulaires transduites. Les études in vivo sur les souris à partir des cellules transduites nous a permis de démontrer l’effet tumeur suppresseur de de miR-92a et l’effet oncogénique de FOXP1. L’expression plus élevée de miR-92a et la sous-expression de FOXP1 au niveau ARN et protéique a également été retrouvé dans les prélèvements humains de PMBL, alors que le niveau d’expression de miR-92a était bas et FOXP1 était haut dans les DLBCL. Nous en avons conclu à une régulation post-transcriptionnelle de FOXP1 par miR-92a dans les PMBL, avec une relevance clinico-pathologique pour mieux caractériser les PMBL. / Primary mediastinal large B-cell lymphoma (PMBL) shares pathological features with diffuselarge B-cell lymphoma (DLBCL), and molecular features with classical Hodgkin lymphoma (cHL). The miR-17-92 oncogenic cluster, located at chromosome 13q31, is a region that is amplified in DLBCL. Here we compared the expression of each member of the miR-17-92 oncogenic cluster insamples from 40 PMBL patients versus 20 DLBCL and 20 cHL patients, and studied the target genes linked to deregulated miRNA in PMBL. We found a higher level of miR-92a in PMBL than in DLBCL, but not in cHL. Acombination of in silico prediction and transcriptomic analyses enabled us to identify FOXP1 as a main miR-92a target gene in PMBL, a result so far not established. This was confirmed by 3’UTR, and RNA and protein expressions in transduced cell lines. In vivo studies using the transduced cell lines in mice enabled us to demonstrate a tumor suppressor effect of miR-92aand an oncogenic effect of FOXP1. The higher expression of miR-92a and the down regulation of FOXP1 mRNA and proteinwere also found in human samples of PMBL, while miR-92a expression was low and FOXP1was high in DLBCL. We concluded to a post-transcriptional regulation by miR-92a through FOXP1 targeting in PMBL, with a clinico-pathological relevance for better characterisation of PMBL.

Page generated in 0.091 seconds