Return to search

Approches évolutionnaires pour la reconstruction de réseaux de régulation génétique par apprentissage de réseaux bayésiens / Learning bayesian networks with evolutionary approaches for the reverse-engineering of gene regulatory networks

De nombreuses fonctions cellulaires sont réalisées grâce à l'interaction coordonnée de plusieurs gènes. Identifier le graphe de ces interactions, appelé réseau de régulation génétique, à partir de données d'expression de gènes est l'un des objectifs majeurs de la biologie des systèmes. Dans cette thèse, nous abordons ce problème en choisissant de modéliser les relations entre gènes par un réseau bayésien. Se pose alors la question de l'apprentissage de la structure de ce type de modèle à partir de données qui sont en général peu nombreuses. Pour résoudre ce problème, nous recherchons parmi tous les modèles possibles le modèle le plus simple, expliquant le mieux les données. Pour cela, nous introduisons et étudions différents types d'algorithmes génétiques permettant d'explorer l'espace des modèles. Nous nous intéressons plus particulièrement aux méthodes de spéciation. ces dernières, en favorisant la diversité des solutions candidates considérées, empêchent l'algorithme de converger trop rapidement vers des optima locaux. Ces algorithmes génétiques sont comparés avec différentes méthodes d'apprentissage de structure de réseaux bayésiens, classiquement utilisées dans la littérature. Nous mettons ainsi en avant la pertinence des approches evolutionnaires pour l'apprentissage de ces graphes d'interactions. Enfin, nous les comparons à une classe alternative d'algorithmes évolutionnaires qui s'avère particulièrement prometteuse : les algorithmes à estimation de distribution. Tous ces algorithmes sont testés et comparés sur un modèle du réseau de régulation de l'insuline de 35 noeuds dont nous tirons des jeux de données synthétiques de taille modeste. / Inferring gene regulatory networks from data requires the development of algorithms devoted to structure extraction. When only static data are available, gene interactions may be modelled by a bayesian network that represents the presence of direct interactions from regulators to regulees by conditional probability distributions. In this work, we used enhanced evolutionary algorithms to stochastically evolve a set of candidate bayesian network structures and found the model that best fits data without prior knowledge. We proposed various evolutionary strategies suitable for the task and tested our choices using simulated data drawn from a given bio-realistic network of 35 nodes, the so-called insulin network, which has been used in the literature for benchmarking. We introduced a niching strategy that reinforces diversity through the population and avoided trapping of the algorithm in one local minimum in the early steps of learning. We compared our best evolutionary approach with various well known learning algorithms (mcmc, k2, greedy search, tpda, mmhc) devoted to bayesian network structure learning. Then, we compared our best genetic algorithm with another class of evolutionary algorithms : estimation of distribution algorithms. We show that an evolutionary approach enhanced by niching outperforms classical structure learning methods in elucidating the original model. Finally, it appears that estimation of distribution algorithms are a promising approach to extend this work. These results were obtained for the learning of a bio-realistic network and, more importantly, on various small datasets.

Identiferoai:union.ndltd.org:theses.fr/2008EVRY0039
Date24 September 2008
CreatorsAuliac, Cédric
ContributorsEvry-Val d'Essonne, Alché-Buc, Florence d'
Source SetsDépôt national des thèses électroniques françaises
LanguageFrench
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text, Image, StillImage

Page generated in 0.0117 seconds