Spelling suggestions: "subject:"inférence dde réseaux"" "subject:"inférence dee réseaux""
1 |
Understanding responses to external stimuli using network-based approaches / Vers une meilleur compréhension des réponses cellulaires aux stimuli externes en utilisant des approches informatiques dit réseauxGwinner, Konrad Frederik 15 May 2014 (has links)
Pendant mes travaux de thèse, j'ai développé et appliqué des méthodes informatiques utilisant des données de réseaux afin d'aider l'analyse des données biologiques à haut-débit. Ma thèse consiste en trois projets : L'identification de protéines supplémentaires dans des approches de protéomique différentielle à l'aide des réseaux d'interaction protéiques, l'identification de réseaux régulatoires sous-jacents aux réponses aux stress abiotiques dans arabidopsis thaliana et l'analyse de signature transcriptomique de réponse immunitaire d'hôte spécifique à différentes étapes d'infection par shigella flexneri. / In the course of my Ph.D work, i have developed and applied methods making use of network information to adavance the analysis of high-throughput biological data. My thesis comprises three projects :- The identification of additional proteins in differential protemics using protein interaction networks. In this study, we developed a novel computational approach based on protein-protein interaction networks to identify a list of proteins that might have remained undetected in differential proteomic profiling experiments.- The transcriptional regulatory networks underlying responses to environmental stresses. Based on publicly available data, measuring the response of A. Thaliana to a set of abiotic stresses in a time-resolved manner, we applied two complimentary approaches to derive gene regulatory networks underlying the plant's response to the perceived stresses.- The analysis of transcriptional host immune response signatures specific for distinct stages of infection by shigella flexneri. During their host invasion process, shigella localize to different subcellular niches.
|
2 |
Méthodes d’ensemble pour l’inférence de réseaux de régulation coopératifs / Ensemble methods for genes regulatory networks inferenceChebil, Inès 26 September 2014 (has links)
La reconstruction des réseaux de régulation génétique (GRNs) est une étape importante pour la compréhension des mécanismes de régulation complexes régissant le fonctionnement de la cellule. De nombreuses approches de modélisation ont été introduites pour inférer le lien de causalité entre les gênes à l'aide des données d'expression génétiques. Cependant, les performances de ces approches sont limitées principalement a causé a des données de grande dimension. En plus, ces méthodes ne restent pas généralement la réalité biologique ou l'interaction entre gêne est réalisée d'une manière coopérative mais considèrent un modèle plus simple ou seules les interactions binaires sont considérées. Dans cette thèse, nous présentons de nouvelles méthodes d'inférence de GRN coopératifs afin améliorer la stabilité et la précision de la reconstruction des GRN en utilisant des techniques d'ensemble. Pour un gêne cible donne, nous extrayons un ensemble de GRNs coopératifs a partir de données discrétisées d'expression. Les GRNs ainsi que les interactions génétiques inférés sont classés selon leur importance en utilisant la régression linéaire sur la base des données d'expression continues. Les évaluations menées sur les données du challenge Dream5 et sur des données humaines de cancer de la vessie démontrent que nos méthodes sont efficaces, tout particulièrement si la taille des données d'apprentissage est petite. / Reconstruction of Gene Regulatory Networks (GRNs) is an important step towards understanding the complex regulatory mechanisms within the cell. Many modeling approaches have been introduced ti find the causal relationship between genes using expression data. However, they surfer from the high dimensionality problem i.e., having a large number of genes but a small number of samples negatively impacts the results. Moreover, these models do not truthfully reflect the biological system where genes interactions are performed in a cooperative manner but rather simplify the problem by tackling only binary interactions. In this thesis, we present new methods for cooperative GRN inference to improve the stability and accuracy of GRNs reconstruction leveraging ensemble methods. For a given target gene, we extract an ensemble of GRNs from discretized expression data. Inferred networks are then evaluated by ranking individual regulation relationships using a regression based technique and continuous expression data. Evaluations on Dream5 challenge data as well as human cancer data demonstrate that our methods are effcient, especially when operating on a small data set.
|
3 |
Statistique asymptotique dans des modèles à variables latentesMatias, Catherine 17 October 2008 (has links) (PDF)
Je présente dans ce manuscrit mes travaux de recherche effectués depuis la thèse. Mes thèmes de recherche sont principalement motivés par des applications en génomique ou post-génomique. Mon domaine de recherche est assez vaste, mais le dénominateur commun de mes travaux est la présence de variables latentes (non observées) dans les modèles étudiés. Mes préoccupations sont majoritairement théoriques : éudes asymptotiques, convergence des estimateurs, vitesses, identifiabilité... Les modèles considérés peuvent être aussi bien paramétriques que semi ou non paramétriques, et les outils statistiques utilisés sont donc relativement variés.<br /><br />Ma présentation s'organise en trois grandes thématiques : les travaux portant sur des séquences, notamment sur la modélisation de leur distribution et des processus d'évolution sous-jacents ; les travaux de statistique semi ou non paramétrique portant sur des signaux observés avec du bruit ; et enfin les travaux (en partie en cours) portant sur les graphes aléatoires.
|
4 |
Inférence de réseaux de régulation de gènes à partir de données dynamiques multi-échelles / Gene regulatory network inference from dynamic multi-scale dataBonnaffoux, Arnaud 12 October 2018 (has links)
L'inférence des réseaux de régulation de gènes (RRG) à partir de données d'expression est un défi majeur en biologie. L’arrivée des technologies de mesure de transcriptomique à l’échelle de la cellule a suscité de nombreux espoirs, mais paradoxalement elles montrent une nouvelle complexité du problème d’inférence des RRG qui limite encore les approches existantes. Nous avons commencé par montrer, à partir de données d'expression en cellules uniques acquises sur un modèle aviaire de différenciation érythrocytaire, que les RRG sont des systèmes stochastiques à l'échelle de la cellule et qu'il y a une évolution dynamique de cette stochasticité au cours du processus de différenciation (Richard et al, PLOS Comp.Biol., 2016). C'est pourquoi nous avons développé par la suite un modèle de RRG mécaniste qui inclus cette stochasticité afin d'exploiter au maximum l'information des données expérimentales à l'échelle de la cellule (Herbach et al, BMC Sys.Biol., 2017). Ce modèle décrit les interactions entre gènes comme un couplage de processus de Markov déterministes par morceaux. En régime stationnaire une formule explicite de la distribution jointe est dérivée du modèle et peut servir à inférer des réseaux simples. Afin d'exploiter l'information dynamique et d'intégrer d'autres données expérimentales (protéomique, demi-vie des ARN), j’ai développé à partir du modèle précédent une approche itérative, intégrative et parallèle, baptisée WASABI qui est basé sur le concept de vague d'expression (Bonnaffoux et al, en révision, 2018). Cette approche originale a été validée sur des modèles in-silico de RRG, puis sur nos données in-vitro. Les RRG inférés affichent une structure de réseau originale au regard de la littérature, avec un rôle central du stimulus et une topologie très distribuée et limitée. Les résultats montrent que WASABI surmonte certaines limitations des approches existantes et sera certainement utile pour aider les biologistes dans l’analyse et l’intégration de leurs données. / Inference of gene regulatory networks from gene expression data has been a long-standing and notoriously difficult task in systems biology. Recently, single-cell transcriptomic data have been massively used for gene regulatory network inference, with both successes and limitations.In the present work we propose an iterative algorithm called WASABI, dedicated to inferring a causal dynamical network from timestamped single-cell data, which tackles some of the limitations associated with current approaches. We first introduce the concept of waves, which posits that the information provided by an external stimulus will affect genes one-byone through a cascade, like waves spreading through a network. This concept allows us to infer the network one gene at a time, after genes have been ordered regarding their time of regulation. We then demonstrate the ability of WASABI to correctly infer small networks, which have been simulated in-silico using a mechanistic model consisting of coupled piecewise-deterministic Markov processes for the proper description of gene expression at the single-cell level. We finally apply WASABI on in-vitro generated data on an avian model of erythroid differentiation. The structure of the resulting gene regulatory network sheds a fascinating new light on the molecular mechanisms controlling this process. In particular, we find no evidence for hub genes and a much more distributed network structure than expected. Interestingly, we find that a majority of genes are under the direct control of the differentiation-inducing stimulus. Together, these results demonstrate WASABI versatility and ability to tackle some general gene regulatory networks inference issues. It is our hope that WASABI will prove useful in helping biologists to fully exploit the power of time-stamped single-cell data.
|
5 |
Graph algorithms : network inference and planar graph optimization / Algorithmes des graphes : inférence des réseaux et optimisation dans les graphes planairesZhou, Hang 06 July 2015 (has links)
Cette thèse porte sur deux sujets d’algorithmique des graphes. Le premier sujet est l’inférence de réseaux. Quelle est la complexité pour déterminer un graphe inconnu à partir de requêtes de plus court chemin entre ses sommets ? Nous supposons que le graphe est de degré borné. Dans le problème de reconstruction, le but est de reconstruire le graphe ; tandis que dans le problème de vérification, le but est de vérifier qu’un graphe donné est correct. Nous développons des algorithmes probabilistes utilisant une décomposition en cellules de Voronoi. Ensuite, nous analysons des algorithmes de type glouton, et montrons qu’ils sont quasi-optimaux. Nous étudions aussi ces problèmes sur des familles particulières de graphes, démontrons des bornes inférieures, et étudions la reconstruction approximative. Le deuxième sujet est l’étude de deux problèmes d’optimisation sur les graphes planaires. Dans le problème de classification par corrélations, l’entrée est un graphe pondéré, où chaque arête a une étiquette h+i ou h-i, indiquant si ses extrémités sont ou non dans la même catégorie. Le but est de trouver une partition des sommets en catégories qui respecte au mieux les étiquettes. Dans le problème d’augmentation 2-arête-connexe, l’entrée est un graphe pondéré et un sous-ensemble R des arêtes. Le but est de trouver un sous-ensemble S des arêtes de poids minimum, tel que pour chaque arête de R, ses extrémités sont dans une composante 2-arête-connexe de l’union de R et S. Pour les graphes planaires, nous réduisons le premier problème au deuxième et montrons que les deux problèmes, bien que NP-durs, ont un schéma d’approximation en temps polynomial. Nous utilisons la technique récente de décomposition en briques. / This thesis focuses on two topics of graph algorithms. The first topic is network inference. How efficiently can we find an unknown graph using shortest path queries between its vertices? We assume that the graph has bounded degree. In the reconstruction problem, the goal is to find the graph; and in the verification problem, the goal is to check whether a given graph is correct. We provide randomized algorithms based on a Voronoi cell decomposition. Next, we analyze greedy algorithms, and show that they are near-optimal. We also study the problems on special graph classes, prove lower bounds, and study the approximate reconstruction. The second topic is optimization in planar graphs. We study two problems. In the correlation clustering problem, the input is a weighted graph, where every edge has a label of h+i or h−i, indicating whether its endpoints are in the same category or in different categories. The goal is to find a partition of the vertices into categories that tries to respect the labels. In the two-edge-connected augmentation problem, the input is a weighted graph and a subset R of edges. The goal is to produce a minimum-weight subset S of edges, such that for every edge in R, its endpoints are two-edge-connected in the union of R and S. For planar graphs, we reduce correlation clustering to two-edge-connected augmentation, and show that both problems, although they are NP-hard, have a polynomial-time approximation scheme. We build on the brick decomposition technique developed recently.
|
6 |
Comparaison et évaluation d’approches bioinformatiques et statistiques pour l'analyse du pathobiome des plantes cultivées / Comparison and evaluation of bioinformatic and statistical approaches for the analysis of the pathobiome of crop plantsPauvert, Charlie 12 November 2019 (has links)
Les interactions entre micro-organismes sous-tendent de nombreux services écosystémiques, y compris la régulation des maladies des plantes cultivées. Un acteur de cette régulation est le pathobiome, défini comme le sous-ensemble des micro-organismes associés à une plante hôte en interaction avec un agent pathogène. L'un des défis actuels consiste à reconstruire les pathobiomes à partir de données de metabarcoding, pour identifier des agents potentiels de biocontrôle et pour surveiller en temps réel leurs réponses aux changements environnementaux. Plusieurs verrous méthodologiques doivent cependant être levés pour atteindre ces objectifs. Tout d’abord, il n’existe pas de consensus concernant l’approche bioinformatique la plus fiable pour déterminer l’identité et l’abondance des micro-organismes présents dans les échantillons végétaux. De plus, les réseaux microbiens construits avec les méthodes actuellement disponibles sont des réseaux d’associations statistiques entre des comptages de séquences, non directement superposables aux réseaux d’interactions (ex : compétition, parasitisme) entre micro-organismes. L’objectif de la thèse était donc de déterminer les approches bioinformatiques et statistiques les plus pertinentes pour reconstruire des réseaux d’interactions microbiennes à partir de données de metabarcoding. Le modèle d’étude était la vigne (Vitis vinifera L. cv. Merlot noir) et l’oïdium de la vigne, Erysiphe necator. Nous avons tout d’abord déterminé l’approche bioinformatique la plus adaptée pour identifier la communauté fongique associée à ce pathogène, en comparant la capacité de 360 pipelines à retrouver la composition d’une communauté artificielle de 189 souches fongiques. DADA2 est apparu comme l’outil le plus performant. Nous avons ensuite évalué l’influence de la pratique culturale (viticulture conventionnelle vs. biologique) sur les communautés fongiques des feuilles et évalué le niveau de réplicabilité des réseaux microbiens construits avec une méthode d’inférence classique, SparCC. La réplicabilité était très faible, jetant ainsi un doute sur l’utilité de ces réseaux pour le biocontrôle et la biosurveillance. Nous avons donc utilisé une nouvelle approche statistique, le modèle PLN, qui permet de prendre en compte la variabilité environnementale, pour explorer finement le pathobiome d’Erysiphe necator. Les interactions microbiennes prédites par le modèle sont en cours de comparaison avec des expériences de confrontations de levures en co-cultures. Une approche alternative, HMSC, a également été testée sur un autre modèle biologique et certaines prédictions ont été confrontées avec succès aux données de la littérature. Les réseaux microbiens, sous réserve d’amélioration des méthodes de reconstruction, pourraient donc être utilisés pour capturer les signaux des interactions biotiques dans le pathobiome. / Interactions between microorganisms underpin many ecosystem services, including the regulation of crop diseases. An actor in this regulation is the pathobiome, defined as the subset of microorganisms associated with a host plant in interaction with a pathogen. One of the current challenges is to reconstruct pathobiomes from metabarcoding data, in order to identify potential biocontrol agents and to monitor in real time their responses to environmental changes. However, several methodological hurdles must be overcomed to achieve these objectives. First, there is no consensus on the most reliable bioinformatics approach to determine the identity and abundance of microorganisms present in plant samples. In addition, microbial networks built with currently available methods are networks of statistical associations between sequence counts, not directly related to networks of interactions (e. g. competition, parasitism) between microorganisms. The objective of the thesis was therefore to determine the most relevant bioinformatics and statistical approaches to reconstruct microbial interaction networks from metabarcoding data. The study system was grapevine (Vitis vinifera L. cv. Merlot noir) and the fungal agent of grapevine powdery mildew Erysiphe necator. First, we determined the most appropriate bioinformatics approach to identify the fungal community associated with this pathogen, by comparing the ability of 360 pipelines to recover the composition of an artificial community of 189 fungal strains. DADA2 has emerged as the most powerful tool. We then evaluated the influence of the cropping system (conventional vs. organic viticulture) on foliar fungal communities and assessed the level of replicability of microbial networks built with a standard inference method, SparCC. Replicability was very low, casting doubt on the usefulness of these networks for biocontrol and biomonitoring We therefore used a new statistical approach, the PLN model, which allows us to take into account environmental variability, to finely explore the pathobiome of Erysiphe necator. The microbial interactions predicted by the model are being compared with experiments confronting yeasts in co-cultures. An alternative approach, HMSC, was also tested on another biological model and some predictions were successfully compared with the data in the literature. Microbial networks, provided improved reconstruction methods, could therefore be used to capture signals of biotic interactions in the pathobiome.
|
7 |
Inférence des réseaux de régulation de la synthèse des protéines de réserve du grain de blé tendre (Triticum aestivum L.) en réponse à l'approvisionnement en azote et en soufre / Inference and analysis of regulatory networks involved in wheat (Triticum aestivum L.) grain storage protein synthesis and their response to nitrogen and sulfur supplyVincent, Jonathan 10 September 2014 (has links)
La teneur et la composition en protéines de réserve du grain de blé tendre (Triticum aestivum L.) sont les principaux déterminants de sa valeur d’usage et de sa qualité nutritionnelle. La composition en protéines de réserve du grain est déterminée par la teneur en assimilâts azotés et soufrés par grain via des lois d’échelle qui pourraient être les propriétés émergentes de réseaux de régulation. Plusieurs facteurs de transcription intervenant dans cette régulation ont été mis en évidence, mais les voies et mécanismes impliqués sont encore très peu connus. Le constat est identique en ce qui concerne l’impact de la nutrition azotée et soufrée sur ce réseau de régulation. Le développement des outils de génomique fonctionnelle et de bioinformatique permet aujourd’hui d’aborder ces régulations de manière globale via une approche systémique mettant en relation plusieurs niveaux de régulation. L’objectif du travail présenté est d’explorer les réseaux de régulation –omiques impliqués dans le contrôle de l’accumulation des protéines de réserve dans le grain de blé tendre et leur réponse à l’approvisionnement en azote et en soufre. Une approche d’inférence de réseaux basée sur la découverte de règles a été étendue, implémentée sous la forme d’une plateforme web. L’utilisation de cette plateforme a permis de définir des sémantiques multiples afin d’inférer dans un cadre global, des règles possédant différentes significations biologiques. Des facteurs de transcription spécifiques de certains organes et certaines phases de développement ont été mis en évidence et un intérêt particulier a été apporté à leur position dans les réseaux de règles inférés, notamment en relation avec les protéines de réserve. Les travaux initiés dans cette thèse ouvrent un champ d’investigation innovant pour l’identification de nouvelles cibles de sélection variétale pour l’amélioration de la valeur technologique et de la qualité nutritionnelle du blé. Ils devraient ainsi permettre de mieux maîtriser la composition en protéines de réserve et ainsi produire des blés adaptés à des utilisations ciblées ou carencé en certaines fractions protéiques impliquées dans des phénomènes d’allergénicité et d’intolérance du gluten, ce dans un contexte d’agriculture durable et plus économe en intrants. / Grain storage protein content and composition are the main determinants of bread wheat (Triticum aestivum L.) end-use value. Scaling laws governing grain protein composition according to grain nitrogen and sulfur content could be the outcome of a finely tuned regulation network. Although it was demonstrated that the main regulation of grain storage proteins accumulation occurs at the transcriptomic level in cereals, knowledge of the underlying molecular mechanisms is elusive. Moreover, the effects of nitrogen and sulfur on these mechanisms are unknown. The issue of skyrocketing data generation in research projects is addressed by developing high-throughput bioinformatics approaches. Extracting knowledge on from such massive amounts of data is therefore an important challenge. The work presented herein aims at elucidating regulatory networks involved in grain storage protein synthesis and their response to nitrogen and sulfur supply using a rule discovery approach. This approach was extended, implemented in the form of a web-oriented platform dedicated to the inference and analysis of regulatory networks from qualitative and quantitative –omics data. This platform allowed us to define different semantics in a comprehensive framework; each semantic having its own biological meaning, thus providing us with global informative networks. Spatiotemporal specificity of transcription factors expression was observed and particular attention was paid to their relationship with grain storage proteins in the inferred networks. The work initiated here opens up a field of innovative investigation to identify new targets for plant breeding and for an improved end-use value and nutritional quality of wheat in the context of inputs limitation. Further analyses should enhance the understanding of the control of grain protein composition and allow providing wheat adapted to specific uses or deficient in protein fractions responsible for gluten allergenicity and intolerance.
|
8 |
Méthodologie d'extraction et d'analyse de réseaux de régulation de gènes : analyse de la réponse transcriptionnelle à l'irradiation chez S. cerevisiæTouleimat, Nizar 26 November 2008 (has links) (PDF)
La réponse cellulaire aux dommages de l'ADN provoqués par l'irradiation (IR) est relativement bien étudiée mais de nombreuses observations montrent l'implication de l'expression de nombreux gènes. Nous souhaitons identifier les différentes formes de la réponse transcriptionnelle à l'IR et reconstruire un réseau de régulation génique impliqué dans son contrôle. La problématique réside dans l'exploitation de dynamiques d'expression de gènes dans des conditions de perturbations génétiques et dans l'intégration d'informations biologiques systémiques. Nous définissons une approche constituée d'une étape automatisée de déduction de régulations à partir de perturbations et de deux étapes d'induction qui permettent d'analyser la dynamique d'expression des gènes et d'extraire des régulations des données additionnelles. Cela nous a permis d'identifier, chez la levure, une réponse complexe à l'IR et de proposer un modèle de régulation dont certaines relations ont été validées expérimentalement.
|
Page generated in 0.0799 seconds