Un grand nombre de données sont représentables sous la forme d'un graphe (ensemble de nœuds liés par des liens). Dans cet exposé, je montrerai que deux problèmes majeurs concernant l'analyse de ces graphes de terrain, à savoir la détection de communautés (définies comme des groupes de nœuds qu'il est pertinent de rassembler) et la mise au point de mesures de proximité (évaluant dans quelle mesure deux nœuds sont topologiquement proches), sont fortement intriquées. En particulier, je présente une méthode qui permet, à l'aide d'une mesure de proximité, d'isoler des groupes de nœuds. Son principe général de fonctionnement est plutôt simple et peut être décrit comme suit. Étant donné un nœud d'intérêt dans le graphe, on calcule la proximité de chaque nœud dans le graphe à ce nœud d'intérêt. Ensuite, si un petit groupe de nœuds obtient une proximité très élevée à ce nœud d'intérêt et que tous les autres nœuds du graphe ont une proximité très faible, alors on peut directement conclure que le petit groupe de nœuds est "la communauté" du nœud d'intérêt. Je montre ensuite comment décliner cette idée pour résoudre efficacement les trois problèmes suivants : (i) trouver des communautés auxquelles un nœud donné appartient, (ii) compléter un ensemble de nœuds en une communauté et (iii) trouver des communautés recouvrantes dans un réseau. / Many kinds of data can be represented as a graph (a set of nodes linked by edges). In this thesis, I show that two major problems, community detection and the measure of the proximity between two nodes have intricate connexions. Particularly, I will present a framework that, using a proximity measure, can isolate a set of nodes. Its general principle is rather straightforward and can be described as follows. Given a node of interest in a graph, the proximity of all nodes in the network to that node of interest is computed. Then, if a small set of nodes have a high proximity to the node of interest while all other have a small proximity, we can directly conclude that the small set of nodes is the community of the node of interest. I'll then show how to tweak this idea to (i) find all communities of a given node, (ii) complete a set of nodes into a community and (iii) find all overlapping communities in a network. I will validate these methods on real and synthetic network datasets.
Identifer | oai:union.ndltd.org:theses.fr/2015PA066166 |
Date | 15 June 2015 |
Creators | Danisch, Maximilien |
Contributors | Paris 6, Guillaume, Jean-Loup, Le Grand, Bénédicte |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French, English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0016 seconds