Return to search

Multiobjective Biclustering : from gene expression data to GWA data / Biclustering multiobjectif : des données d'expression génétiques aux données d'association génomique

Les puces à ADN sont des matrices qui indiquent les niveaux d’expression de milliers de gènes sous plusieurs conditions. L’analyse de ces données consiste à extraire des gènes qui ont un comportement similaire sous certaines conditions. En fait, les informations extraites sont des sous-matrices (biclusters) qui réspectent certaines contraints de cohérence. Le processus d'extraction est appelé biclustering. Dans cette thèse, nous traitons ce problème dans le contexte multiobjectif appliqué à l’analyse des données biologiques. Par conséquent, plusieurs questions liées à la modélisation des problèmes et la conception d’algorithmes ont été abordées. Tout d’abord, une description du problème est revue. En outre, une nouvelle mesure de la cohérence est proposée. En outre, deux modèles multiobjectif sont proposées afin d’extraire des biclusters de différents types. Par ailleurs, ce travail explore différentes métaheuristiques pour résoudre ces modèles . De plus, différentes hybridations entre les différentes métaheuristiques sont pris en compte. De plus, nous avons proposé une nouvelle application de biclustering, à savoir, l’analyse des données GWA. En fait, les données GWA consiste au génotype et le phénotype d’un ensemble d’individus. L’analyse de ces données consiste à trouver des associations entre des variants génétiques et les traits considérés. De ce fait, un modèle multiobjectifs pour le biclustering est proposé. En outre, un métaheuristique hybride est appliqué pour résoudre le modèle proposé. Les résultats expérimentaux, pour les deux applications, démontrent que les méthodes sont efficaces sur et permettent d'extraire des informations importantes. / Microarray data represents the expression levels of thousands of genes under several conditions. its analysis consists on discovering genes that have similar behavior across a subset of conditions. In fact, the extracted informations are submatrices (biclusters) that satisfy a coherence constraint. The process of extracting them is called biclustering. In this thesis, we deal with biclustering task applied to the analysis of biological data. Accordingly, several issues related to problem modeling and algorithms design have been addressed. First, a description of the problem and the different measures of biclusters coherence are reviewed. Furthermore, a new coherence measure allowing identification of all biclusters types with a low complexity is proposed. Additionally, two multiobjective models for biclustering problem are proposed in order to mine biclusters of different types. Besides problems modeling, this work investigates different metaheuristics to solve biclustering problem. Moreover, different hybridizations between different metaheuristics presenting different behaviors are considered. Additionally, we propose a new application of biclustering task, namely, analysis of GWA data. In fact, GWA data consists in genotype and phenotype informations of a set of individuals. Its analysis consists in finding associations between markers and the considered traits. Thus, a multiobjective model for biclustering method is proposed. Moreover, a hybrid metaheuristic is applied to solve the proposed model. Experimental results, for both applications, demonstrate that the proposed approaches are effective and are able to extract relevant informations from the considered data.

Identiferoai:union.ndltd.org:theses.fr/2013LIL10048
Date05 July 2013
CreatorsSeridi, Khedidja
ContributorsLille 1, Talbi, El-Ghazali, Jourdan, Laetitia
Source SetsDépôt national des thèses électroniques françaises
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.0018 seconds