Spelling suggestions: "subject:"digraphes"" "subject:"bigraphes""
321 |
Méthodes bioinformatiques pour l'analyse de données de séquençage dans le contexte du cancer / Bioinformatics methods for cancer sequencing data analysisRudewicz, Justine 30 June 2017 (has links)
Le cancer résulte de la prolifération excessive de cellules qui dérivent toutes de la même cellule initiatrice et suivent un processus Darwinien de diversification et de sélection. Ce processus est défini par l'accumulation d'altérations génétiques et épigénétiques dont la caractérisation est un élément majeur pour pouvoir proposer une thérapie ciblant spécifiquement les cellules tumorales. L'avènement des nouvelles technologies de séquençage haut débit permet cette caractérisation à un niveau moléculaire. Cette révolution technologique a entraîné le développement de nombreuses méthodes bioinformatiques. Dans cette thèse, nous nous intéressons particulièrement au développement de nouvelles méthodes computationnelles d'analyse de données de séquençage d'échantillons tumoraux permettant une identification précise d'altérations spécifiques aux tumeurs et une description fine des sous populations tumorales. Dans le premier chapitre, il s'agît d'étudier des méthodes d'identification d'altérations ponctuelles dans le cadre de séquençage ciblé, appliquées à une cohorte de patientes atteintes du cancer du sein. Nous décrivons deux nouvelles méthodes d'analyse, chacune adaptée à une technologie de séquençage, spécifiquement Roche 454 et Pacifique Biosciences.Dans le premier cas, nous avons adapté des approches existantes au cas particulier de séquences de transcrits. Dans le second cas, nous avons été confronté à un bruit de fond élevé entraînant un fort taux de faux positifs lors de l'utilisation d'approches classiques. Nous avons développé une nouvelle méthode, MICADo, basée sur les graphes de De Bruijn et permettant une distinction efficace entre les altérations spécifiques aux patients et les altérations communes à la cohorte, ce qui rend les résultats exploitables dans un contexte clinique. Le second chapitre aborde l'identification d'altérations de nombre de copies. Nous décrivons l'approche mise en place pour leur identification efficace à partir de données de très faible couverture. L'apport principal de ce travail consiste en l'élaboration d'une stratégie d'analyse statistique afin de mettre en évidence des changements locaux et globaux au niveau du génome survenus durant le traitement administré à des patientes atteintes de cancer du sein. Notre méthode repose sur la construction d'un modèle linéaire permettant d'établir des scores de différences entre les échantillons avant et après traitement. Dans le troisième chapitre, nous nous intéressons au problème de reconstruction clonale. Cette problématique récente est actuellement en plein essor, mais manque cependant d'un cadre formel bien établi. Nous proposons d'abord une formalisation du problème de reconstruction clonale. Ensuite nous utilisons ce formalisme afin de mettre en place une méthode basée sur les modèles de mélanges Gaussiens. Cette méthode utilise les altérations ponctuelles et de nombre de copies - comme celles abordées dans les deux chapitres précédents - afin de caractériser et quantifier les différentes populations clonales présentes dans un échantillon tumoral. / Cancer results from the excessive proliferation of cells decending from the same founder cell and following a Darwinian process of diversification and selection. This process is defined by the accumulation of genetic and epigenetic alterations whose characterization is a key element for establishing a therapy that would specifically target tumor cells. The advent of new high-throughput sequencing technologies enables this characterization at the molecular level. This technological revolution has led to the development of numerous bioinformatics methods. In this thesis, we are particularly interested in the development of new computational methods for the analysis of sequencing data of tumor samples allowing precise identification of tumor-specific alterations and an accurate description of tumor subpopulations. In the first chapter, we explore methods for identifying single nucleotide alterations in targeted sequencing data and apply them to a cohort of breast cancer patients. We introduce two new methods of analysis, each tailored to a particular sequencing technology, namely Roche 454 and Pacific Biosciences. In the first case, we adapted existing approaches to the particular case of transcript sequencing. In the second case, when using conventional approaches, we were confronted with a high background noise resulting in a high rate of false positives. We have developed a new method, MICADo, based on the De Bruijn graphs and making possible an effective distinction between patient-specific alterations and alterations common to the cohort, which makes the results usable in a clinical context. Second chapter deals with the identification of copy number alterations. We describe the approach put in place for their efficient identification from very low coverage data. The main contribution of this work is the development of a strategy for statistical analysis in order to emphasise local and global changes in the genome that occurred during the treatment administered to patients with breast cancer. Our method is based on the construction of a linear model to establish scores of differences between samples before and after treatment. In the third chapter, we focus on the problem of clonal reconstruction. This problem has recently gathered a lot of interest, but it still lacks a well-established formal framework. We first propose a formalization of the clonal reconstruction problem. Then we use this formalism to put in place a method based on Gaussian mixture models. Our method uses single nucleotide and copy number alterations - such as those discussed in the previous two chapters - to characterize and quantify different clonal populations present in a tumor sample.
|
322 |
Sparsity regularization and graph-based representation in medical imaging / La régularisation parcimonieuse et la représentation à base de graphiques dans l'imagerie médicaleGkirtzou, Aikaterini 17 December 2013 (has links)
Les images médicales sont utilisées afin de représenter l'anatomie. Le caractère non- linéaire d'imagerie médicale rendent leur analyse difficile. Dans cette thèse, nous nous intéressons à l'analyse d'images médicales du point de vue de la théorie statistique de l'apprentissage. Tout d'abord, nous examinons méthodes de régularisation. Dans cette direction, nous introduisons une nouvelle méthode de régularisation, la k-support regularized SVM. Cet algorithme étend la SVM régularisée `1 à une norme mixte de toutes les deux normes `1 et `2. Ensuite, nous nous intéressons un problème de comparaison des graphes. Les graphes sont une technique utilisée pour la représentation des données ayant une structure héritée. L'exploitation de ces données nécessite la capacité de comparer des graphes. Malgré le progrès dans le domaine des noyaux sur graphes, les noyaux sur graphes existants se concentrent à des graphes non-labellisés ou labellisés de façon discrète, tandis que la comparaison de graphes labellisés par des vecteurs continus, demeure un problème de recherche ouvert. Nous introduisons une nouvelle méthode, l'algorithme de Weisfeiler-Lehman pyramidal et quantifié afin d'aborder le problème de la comparaison des graphes labellisés par des vecteurs continus. Notre algorithme considère les statistiques de motifs sous arbre, basé sur l'algorithme Weisfeiler-Lehman ; il utilise une stratégie de quantification pyramidale pour déterminer un nombre logarithmique de labels discrets. Globalement, les graphes étant des objets mathématiques fondamentaux et les méthodes de régularisation étant utilisés pour contrôler des problèmes mal-posés, notre algorithmes pourraient appliqués sur un grand éventail d'applications. / Medical images have been used to depict the anatomy or function. Their high-dimensionality and their non-linearity nature makes their analysis a challenging problem. In this thesis, we address the medical image analysis from the viewpoint of statistical learning theory. First, we examine regularization methods for analyzing MRI data. In this direction, we introduce a novel regularization method, the k-support regularized Support Vector Machine. This algorithm extends the 1 regularized SVM to a mixed norm of both `1 and `2 norms. We evaluate our algorithm in a neuromuscular disease classification task. Second, we approach the problem of graph representation and comparison for analyzing medical images. Graphs are a technique to represent data with inherited structure. Despite the significant progress in graph kernels, existing graph kernels focus on either unlabeled or discretely labeled graphs, while efficient and expressive representation and comparison of graphs with continuous high-dimensional vector labels, remains an open research problem. We introduce a novel method, the pyramid quantized Weisfeiler-Lehman graph representation to tackle the graph comparison problem for continuous vector labeled graphs. Our algorithm considers statistics of subtree patterns based on the Weisfeiler-Lehman algorithm and uses a pyramid quantization strategy to determine a logarithmic number of discrete labelings. We evaluate our algorithm on two different tasks with real datasets. Overall, as graphs are fundamental mathematical objects and regularization methods are used to control ill-pose problems, both proposed algorithms are potentially applicable to a wide range of domains.
|
323 |
Where Social Networks, Graph Rewriting and Visualisation Meet : Application to Network Generation and Information Diffusion / Quand les réseaux sociaux, la réécriture de graphes et la visualisation se rencontrent : application à la génération de réseaux et à la diffusion d'information.Vallet, Jason 07 December 2017 (has links)
Dans cette thèse, nous présentons à la fois une collection de modèles de générations de réseaux et de diffusion d'information exprimés à l'aide d'un formalisme particulier appelé la réécriture de graphes, ainsi qu'une nouvelle méthode de représentation permettant la visualisation de la diffusion d'information dans des grands réseaux sociaux. Les graphes sont des objets mathématiques particulièrement versatiles qui peuvent être utilisés pour représenter une large variété de systèmes abstraits. Ces derniers peuvent être transformés de multiples façons (création, fusion ou altération de leur éléments), mais de telles modifications doivent être contrôlées afin d'éviter toute opération non souhaitée. Pour cela, nous faisons appel au formalisme particulier de la réécriture de graphes afin d'encadrer et de contrôler toutes les transformations. Dans notre travail, un système de réécriture de graphes opère sur un graphe, qui peut être transformé suivant un ensemble de règles, le tout piloté par une stratégie. Nous commençons tout d'abord par utiliser la réécriture en adaptant deux algorithmes de génération de réseaux, ces derniers permettant la création de réseaux aux caractéristiques petit monde. Nous traduisons ensuite vers le formalisme de réécriture différents modèles de diffusion d'information dans les réseaux sociaux. En énonçant à l'aide d'un formalisme commun différents algorithmes, nous pouvons plus facilement les comparer, ou ajuster leurs paramètres. Finalement, nous concluons par la présentation d'un nouvel algorithme de dessin compact de grands réseaux sociaux pour illustrer nos méthodes de propagation d'information. / In this thesis, we present a collection of network generation and information diffusion models expressed using a specific formalism called strategic located graph rewriting, as well as a novel network layout algorithm to show the result of information diffusion in large social networks. Graphs are extremely versatile mathematical objects which can be used to represent a wide variety of high-level systems. They can be transformed in multiple ways (e.g., creating new elements, merging or altering existing ones), but such modifications must be controlled to avoid unwanted operations. To ensure this point, we use a specific formalism called strategic graph rewriting. In this work, a graph rewriting system operates on a single graph, which can then be transformed according to some transformation rules and a strategy to steer the transformation process. First, we adapt two social network generation algorithms in order to create new networks presenting small-world characteristics. Then, we translate different diffusion models to simulate information diffusion phenomena. By adapting the different models into a common formalism, we make their comparison much easier along with the adjustment of their parameters. Finally, we finish by presenting a novel compact layout method to display overviews of the results of our information diffusion method.
|
324 |
Recherches de chemins dans le réseau métabolique et mesure de la distance métabolique entre enzymesCroes, Didier January 2006 (has links)
Doctorat en Sciences / info:eu-repo/semantics/nonPublished
|
325 |
Affectation dynamique dans les systèmes de transport multimodaux / Dynamic assignment of users in a multimodal transportation systemAtmani, Dihya 18 December 2015 (has links)
L'objectif de ce travail consiste à réaliser un système dynamique d'aide aux déplacements multimodal pour les voyageurs équipés d'un système d'information tout en prenant en considération les usagers non équipés de ce type de système. Le travail est alors divisé en deux parties: Une partie conception et développement et une partie étude. La partie développement consiste à construire l'outil informatique d'aide aux déplacements grâce à une modélisation multi-agent et qui renvoie à l'usager un itinéraire qui satisfait ces besoins et ceux du réseau. La partie étude quant à elle, consiste en une approche plus théorique qui consiste à déterminer l'impact de l'information sur les coûts des itinéraires, l'impact de la réorientation des usagers vers les transports en commun sur le réseau routier ainsi que l'intérêt de passer vers des véhicules autonomes / The objective of this work consists on the realization of a dynamic guidance system in a multimodal network for users equipped with an information device while taking into account users that are not equipped with such devices. The work is organized into parts: a conception part and a theoretical study part. The conception part consists on the development of the guidance tool using a multi agent architecture. This tool assists users in their daily travels by giving them the itinerary that suits best not only their needs but also the overall network. The theoretical study emphasizes on how the performance of the network can be enhanced. To do so, three main studies will be presented: the impact of the information on the cost of the itineraries, the impact of the reorientation of users towards transportation systems on the road network and finally the benefits of introducing autonomous vehicles
|
326 |
Sur la theorie spectrale des opérateurs de Schrödinger discretsAkkouche, Sofiane 19 November 2010 (has links)
Cette thèse traite de la théorie spectrale des opérateurs de Schrödinger discrets H(λ) := - Δ + b sur Zd et plus généralement sur des graphes pondérés infinis. Plus précisément, nous étudions le comportement des fonctions spectrales qui représentent les bornes du spectre de ces opérateurs. Un des principaux résultats est l'obtention d'une condition nécessaire et suffisante sur le potentiel b pour que le bas du spectre soit strictement positif. L'étude du haut du spectre est également considérée.Nous étudions tout d'abord ces questions pour les opérateurs de Schrödinger discrets sur Zd. La régularité de cet espace permet alors d'obtenir des résultats spécifiques dans ce cas particulier. Nous généralisons ensuite nos travaux au cas des graphes infinis pondérés. Les techniques développées dans ce cadre nous permettent également d'étudier le comportement asymptotique du bas du spectre pour les grandes valeurs de λ. / This thesis deals with the spectral theory of discrete Schrödinger operators H(λ) := - Δ + b on Zd and more generally on in#nite weighted graphs. Precisely, we study the behavior of the spectral functions which represent the spectral bounds of these operators. One of the main results is the obtention of a necessary and sufficient condition on the potential b such that the bottom of the spectrum is stricly positive.The study of the top of the spectrum is also treated.We first study these questions for discrete Schrödinger operators on Zd. The regularity of this space provides specific results in this particular case. Then we extend our work to the case of infinite weighted graphs. Moreover, the technics developed in this framework allow us to study the asymptotic behavior of the bottom of the spectrum for large values of λ.
|
327 |
Visualisation d'information : de la théorie sémiotique à des exemples pratiques basés sur la représentation de graphes et d'hypergraphes / Information visualization : from semiotic theory to practical examples based on graphs and hypergraphs representationSallaberry, Arnaud 18 October 2011 (has links)
La visualisation d'information est une discipline récente en pleine expansion et qui a pour objet l'étude des méthodes de représentation visuelle de données abstraites, c'est-à-dire non géolocalisées. La sémiotique est quant à elle une discipline beaucoup plus ancienne (fin du XIXième siècle) qui s'intéresse aux divers systèmes de signes nécessaires aux processusde communication. A ce jour, peu de travaux ont été réalisés pour mettre en parallèle ces deux disciplines. C'est pourquoi le premier chapitre de cette thèse est dédié à l'étude de la visualisation d'information selon les paradigmes élaborés par son ainée tout au long du XXième siècle. Nous montrons en particulier comment l'un des modèles les plus aboutis de validation de visualisations (modèle imbriqué de Tamara Munzner) correspond au processus d'étude sémiotique d'énoncés. Le second chapitre est consacré à la visualisation de graphe, outil de modélisation puissant de divers ensembles de données abstraites. Nous proposons d'une part une application permettant de visualiser et de naviguer à travers les pages Internet retournées par un moteur de recherche et d'autre part un algorithme de visualisation de hiérarchies dynamiques sous forme de "cartes géographiques". Enfin, nous évoquons dans le troisième chapitre un autre outil de modélisation de donnéesabstraites : les hypergraphes. Nous proposons des résultats théoriques concernant leur représentation et donnons une ébauche de solution permettant de les visualiser. / Information visualization aims at designing visual representations of abstract data, furthermore relying on interaction as a mean to discover knowledge. The first part of this thesis challenges Information Visualization by drawing a parallel with semiotics, a 19th century research field focusing on systems of signs required for communication. We develop a point of view on Information Visualization based on the paradigms developed by semioticians during the 20th century. In particular, we show how the visualization validation model proposed by Tamara Munzner is related to the process used by semioticians for utterance analysis. The second part of the thesis focuses on graph visualization and describes two techniques and system prototypes targeting specific application domains. The first one is an interactive technique to visualize and navigate through Web search results. The second one is an algorithm for the visualization of dynamic hierarchies exploiting the analogy with “geographical maps”. Finally, the third chapter is devoted to another model used to structure abstract data : hypergraphs. We propose theoretical results on hypergraph drawing and a preliminary technique to visualize hypergraphs.
|
328 |
Méthodes et modèles pour la visualisation de grandes masses de données multidimensionnelles nominatives dynamiques / Methods and model for huge amount of nominative multidimendionnal dynamic data visualizationGilbert, Frédéric 21 March 2012 (has links)
La visualisation d'informations est un domaine qui connaît un réel intérêt depuis une dizaine d'années. Dernièrement, avec l'explosion des moyens de communication, l'analyse de réseaux sociaux fait l'objet de nombreux travaux de recherches. Nous présentons dans cette thèse des travaux sur l'analyse de réseaux sociaux dynamiques, c'est à dire que nous prenons en compte l'aspect temporel des données. [...] / Since ten years, informations visualization domain knows a real interest.Recently, with the growing of communications, the research on social networks analysis becomes strongly active. In this thesis, we present results on dynamic social networks analysis. That means that we take into account the temporal aspect of data. We were particularly interested in communities extraction within networks and their evolutions through time. [...]
|
329 |
Fluides, graphes et transformée de Fourier : trois incarnations du laplacien / Fluids, graphs and Fourier transform : three incarnations of the laplacianLévy, Guillaume 08 November 2017 (has links)
Cette thèse est consacrée à l'étude de propriétés du laplacien dans trois contextes bien distincts. Dans une première partie, celui-ci nous sera utile pour régulariser des solutions d'équations venues de la mécanique des fluides incompressibles. En application, on montrera un théorème dans la lignée des résultats de J. Serrin et de ses continuateurs. Dans une deuxième partie, le laplacien est vu comme le pendant stationnaire de l'opérateur des ondes sur un graphe, dont les modes et fréquences propres déterminent la propagation de perturbations sur le graphe. On y explore et démêle les liens entre la topologie du graphe, sa forme et sa première fréquence propre non nulle. Dans une dernière partie, le laplacien est pensé comme un opérateur linéaire à diagonaliser dans une base adaptée, objectif dont l'accomplissement est intimement lié à la transformée de Fourier. Deux difficultés majeures apparaissent ici : la non commutativité des groupes auxquels nous nous intéressons d'une part, l'apparition d'une limite singulière de la transformée de Fourier d'autre part. / This thesis is devoted to the study of the laplacian properties in three fully distinct contexts.In a first part, it will be used to smooth solutions of equations coming from incompressible fluid mechanics.As an application, we will show a result in the spirit of J. Serrin and his continuators' theorem.In a second part, the laplacien is seen as the stationary counterpart of the wave operator on a graph, whose eigenmodes and eigenfrequencies determine the propagation of perturbations on the graph.We explore and disentangle the ties between the graph's topology, its shape and its first nonzero eigenfrequency.In the last part, the laplacian is thought of as a linear operator which we wish to diagonalize in an appropriate basis, a goal which is intimately tied to the Fourier transform.Two major difficulties appear in our context : the noncommutativity of the groups of interest on the one hand, the appearance of a singular limit in the Fourier transform on the other hand.
|
330 |
Utilisation des modèles de co-clustering pour l'analyse exploratoire des données / No English title availableGuigourès, Romain 04 December 2013 (has links)
Le co-clustering est une technique de classification consistant à réaliser une partition simultanée des lignes et des colonnes d’une matrice de données. Parmi les approches existantes, MODL permet de traiter des données volumineuses et de réaliser une partition de plusieurs variables, continues ou nominales. Nous utilisons cette approche comme référence dans l’ensemble des travaux de la thèse et montrons la diversité des problèmes de data mining pouvant être traités, comme le partitionnement de graphes, de graphes temporels ou encore le clustering de courbes. L’approche MODL permet d’obtenir des résultats fins sur des données volumineuses, ce qui les rend difficilement interprétables. Des outils d’analyse exploratoire sont alors nécessaires pour les exploiter. Afin de guider l'utilisateur dans l'interprétation de tels résultats, nous définissons plusieurs outils consistant à simplifier des résultats fins afin d’en avoir une interprétation globale, à détecter les clusters remarquables, à déterminer les valeurs représentatives de leurs clusters et enfin à visualiser les résultats. Les comportements asymptotiques de ces outils d’analyse exploratoire sont étudiés afin de faire le lien avec les approches existantes.Enfin une application sur des comptes-rendus d’appels de l’opérateur Orange, collectés en Côte d’Ivoire, montre l’intérêt de l’approche et des outils d’analyse exploratoire dans un contexte industriel. / Co-clustering is a clustering technique aiming at simultaneously partitioning the rows and the columns of a data matrix. Among the existing approaches, MODL is suitable for processing huge data sets with several continuous or categorical variables. We use it as the baseline approach in this thesis. We discuss the reliability of applying such an approach on data mining problems like graphs partitioning, temporal graphs segmentation or curve clustering.MODL tracks very fine patterns in huge data sets, that makes the results difficult to study. That is why, exploratory analysis tools must be defined in order to explore them. In order to help the user in interpreting the results, we define exploratory analysis tools aiming at simplifying the results in order to make possible an overall interpretation, tracking the most interesting patterns, determining the most representative values of the clusters and visualizing the results. We investigate the asymptotic behavior of these exploratory analysis tools in order to make the connection with the existing approaches.Finally, we highlight the value of MODL and the exploratory analysis tools owing to an application on call detailed records from the telecom operator Orange, collected in Ivory Coast.
|
Page generated in 0.0464 seconds