Mesures de proximité appliquées à la détection de communautés dans les grands graphes de terrain
Auteur / Autrice : | Maximilien Danisch |
Direction : | Jean-Loup Guillaume, Bénédicte Le Grand |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 15/06/2015 |
Etablissement(s) : | Paris 6 |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris |
Partenaire(s) de recherche : | Laboratoire : LIP6 (1997-....) |
Jury : | Examinateurs / Examinatrices : Alain Barrat, Rushed Kanawati, Matthieu Latapy, Bivas Mitra |
Rapporteurs / Rapporteuses : David Auber, Céline Robardet |
Mots clés
Résumé
Un grand nombre de données sont représentables sous la forme d'un graphe (ensemble de nœuds liés par des liens). Dans cet exposé, je montrerai que deux problèmes majeurs concernant l'analyse de ces graphes de terrain, à savoir la détection de communautés (définies comme des groupes de nœuds qu'il est pertinent de rassembler) et la mise au point de mesures de proximité (évaluant dans quelle mesure deux nœuds sont topologiquement proches), sont fortement intriquées. En particulier, je présente une méthode qui permet, à l'aide d'une mesure de proximité, d'isoler des groupes de nœuds. Son principe général de fonctionnement est plutôt simple et peut être décrit comme suit. Étant donné un nœud d'intérêt dans le graphe, on calcule la proximité de chaque nœud dans le graphe à ce nœud d'intérêt. Ensuite, si un petit groupe de nœuds obtient une proximité très élevée à ce nœud d'intérêt et que tous les autres nœuds du graphe ont une proximité très faible, alors on peut directement conclure que le petit groupe de nœuds est "la communauté" du nœud d'intérêt. Je montre ensuite comment décliner cette idée pour résoudre efficacement les trois problèmes suivants : (i) trouver des communautés auxquelles un nœud donné appartient, (ii) compléter un ensemble de nœuds en une communauté et (iii) trouver des communautés recouvrantes dans un réseau.