Return to search

Decentralized Diffusion-Controlled Algorithm for Community Detection : Initialization and Resolution Study

Community detection in graphs has been an important research topic for many fields. The aim of community detection is to extract from graphs those groups of nodes that present more connections between them than with the rest of the network. Detecting such groups at different scales can help understanding the global behaviour of the system. However, recent studies have shown that realworld graphs follow power-law distributions for degree and community sizes. Specifically, these graphs present many small communities but just a few large ones. This unbalanced community size distribution poses a great challenge for community detection algorithms.Most of the existing methods are based on global approaches that require information about the network to be processed as a whole. Thus, those techniques can not be applied when the graph is too big to fit into one single machine, or in distributed setting when the graph is partitioned among multiple machines. To solve this limitations, a completely decentralized community detection algorithm is presented. It is based on diffusion, following a vertex-centric approach that allows each node to decide the diffusion rates based on local information. It adds as well a mechanism for controlling the diffusion speed through a customizable function.We evaluate the algorithm with a variety of graphs with different levels of imbalance and community structures. Our algorithm is able to detect (almost) perfectly the communities when the imbalance between community sizes is not extreme. We show as well how the sizes of the detected communities can be controlled by the diffusion strategy, allowing for better detection of finer or coarser resolutions in hierarchical graphs. The algorithm is also compared to other two well-known existing methods, achieving similar results in most of the cases though with a higher computation time. / Gemenskap detektering i grafer har varit ett viktigt forsknings ämne förmånga områden. Gemenskapsdetekterings syftet är att extrahera ur grafernade grupper av noder som har mer kopplingar mellan varandra än med restenav nätverket. Att upptäcka sådana grupper i olika skaler kan hjälpa till att förstå systemets globala beteende. Däremot har nyliga studier visat att verkliga grafers grad och gemenskap storlek följer en potenslagen fördelning. Specifikt,dessa grafer uppvisar många små gemenskaper men bara några stora. Denhär obalanserade gemenskaps storleks fördelningen utgör en stor utmaning för gemenskapsdetekterings algoritmer.De flesta av de befintliga metoderna är baserade på globala tillvägagångssätt som kräver att information om nätverket behandlas som helhet. Således kan dessa tekniker inte tillämpas när grafen är för stor för att passa in i en enda maskin, eller på distribuerat sätt när grafen är uppdelad bland flera maskiner. För att lösa dessa begränsningar, uppvisas en helt decentraliserad gemenskapsdetekterings algoritm.Denär baserad pådiffusion som följer en vertex-centrerad tillvägagångssätt.Varje node valder diffusionshastigheten baserad på lokal information. Deninnehåller även en mekanism som kontrollerar diffusionens hastighet genom en anpassningsbar funktion.Vi utvärderar algoritmen genom flera olika grafer med olika nivåer av obalans och gemenskaps strukurer. Vår algoritm kan (nästan) felfritt upptäcka gemenskaper där obalansen mellan dem inte är för stor. Vi visar även hur storlekenpå de hittade gemenskaperna kan kontrolleras genom diffusions strategin, somtillåter bättre uptäckt av finare eller grövre resolution av hierarkiska grafer. Algoritmen kan också jämföras med två befintliga, välkända metoder, vilka ger liknande resultat i de flesta fallen men tar längre tid att genomföra.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-215720
Date January 2017
CreatorsRamirez, Adrian
PublisherKTH, Skolan för informations- och kommunikationsteknik (ICT)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-ICT-EX ; 2017:154

Page generated in 0.0024 seconds