Mesures de proximité appliquées à la détection de communautés dans les grands graphes de terrain

par Maximilien Danisch

Thèse de doctorat en Informatique

Sous la direction de Jean-Loup Guillaume et de Bénédicte Le Grand.

Soutenue le 15-06-2015

à Paris 6 , dans le cadre de École doctorale Informatique, télécommunications et électronique de Paris , en partenariat avec Laboratoire d'Informatique de Paris 6 (laboratoire) .

Le jury était composé de David Auber, Céline Robardet, Alain Barrat, Rushed Kanawati, Matthieu Latapy, Bivas Mitra.


  • Résumé

    Un grand nombre de données sont représentables sous la forme d'un graphe (ensemble de nœuds liés par des liens). Dans cet exposé, je montrerai que deux problèmes majeurs concernant l'analyse de ces graphes de terrain, à savoir la détection de communautés (définies comme des groupes de nœuds qu'il est pertinent de rassembler) et la mise au point de mesures de proximité (évaluant dans quelle mesure deux nœuds sont topologiquement proches), sont fortement intriquées. En particulier, je présente une méthode qui permet, à l'aide d'une mesure de proximité, d'isoler des groupes de nœuds. Son principe général de fonctionnement est plutôt simple et peut être décrit comme suit. Étant donné un nœud d'intérêt dans le graphe, on calcule la proximité de chaque nœud dans le graphe à ce nœud d'intérêt. Ensuite, si un petit groupe de nœuds obtient une proximité très élevée à ce nœud d'intérêt et que tous les autres nœuds du graphe ont une proximité très faible, alors on peut directement conclure que le petit groupe de nœuds est "la communauté" du nœud d'intérêt. Je montre ensuite comment décliner cette idée pour résoudre efficacement les trois problèmes suivants : (i) trouver des communautés auxquelles un nœud donné appartient, (ii) compléter un ensemble de nœuds en une communauté et (iii) trouver des communautés recouvrantes dans un réseau.

  • Titre traduit

    Proximity measure applied to community detection in complex networks


  • Résumé

    Many kinds of data can be represented as a graph (a set of nodes linked by edges). In this thesis, I show that two major problems, community detection and the measure of the proximity between two nodes have intricate connexions. Particularly, I will present a framework that, using a proximity measure, can isolate a set of nodes. Its general principle is rather straightforward and can be described as follows. Given a node of interest in a graph, the proximity of all nodes in the network to that node of interest is computed. Then, if a small set of nodes have a high proximity to the node of interest while all other have a small proximity, we can directly conclude that the small set of nodes is the community of the node of interest. I'll then show how to tweak this idea to (i) find all communities of a given node, (ii) complete a set of nodes into a community and (iii) find all overlapping communities in a network. I will validate these methods on real and synthetic network datasets.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Sorbonne Université. Bibliothèque de Sorbonne Université. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.