Détection et analyse de communautés dans les réseaux

par Belkacem Serrour

Thèse de doctorat en Informatique

Sous la direction de Hamamache Kheddouci.

Le président du jury était Christine Largeron.

Le jury était composé de Mohand Saïd Hacid.

Les rapporteurs étaient Jacques Bahi, Olivier Togni.


  • Résumé

    L'étude de structures de communautés dans les réseaux devient de plus en plus une question importante. La connaissance des modules de base (communautés) des réseaux nous aide à bien comprendre leurs fonctionnements et comportements, et à appréhender les performances de ces systèmes. Une communauté dans un graphe (réseau) est définie comme un ensemble de nœuds qui sont fortement liés entre eux, mais faiblement liés avec le reste du graphe. Les membres de la même communauté partagent les mêmes centres d'intérêt. La plupart des travaux qui existent dans ce domaine se scindent en deux grandes thématiques: la détection de communautés et l'analyse de communautés. La détection de communautés consiste à trouver les communautés dans un réseau donné, sans connaître à priori ni la taille ni le nombre des communautés. La partie analyse de communautés, quant à elle, consiste à étudier les propriétés structurelles et sémantiques des communautés détectées et de celles du réseau étudié. Dans cette thèse, nous nous intéressons à l'étude de structures de communautés dans les réseaux. Nous contribuons dans les deux parties, analyse et détection de communautés. Dans la partie analyse de communautés, nos contributions sont l'étude des communautés dans les réseaux de communication et l'étude des communautés dans les services Web. D'une part, nous étudions l'émergence de communautés dans les réseaux de communication. Nous proposons une classification de structures de communautés émergées dans un réseau de communication donné. Nous modélisons les réseaux par les graphes et nous les caractérisons par un ensemble de paramètres. Nous concluons par une corrélation directe entre le réseau initial et les types de structures de communautés émergées. D'autre part, nous étudions les communautés dans les logs de services Web. Nous analysons les historiques d'exécution (les fichiers logs) afin de découvrir les protocoles métiers de services (séquences de messages échangés entre le service et le client pour aboutir à un but donné). Nous modélisons les logs par les graphes, et nous cherchons l'ensemble de conversations (communautés) issues de notre graphe de messages (le graphe de messages est un graphe induit du graphe de logs). Notre contribution dans la partie détection de communautés, est la proposition d'un algorithme de détection de communautés basé sur les motifs utilisant l'optimisation spectrale. Nous définissons une matrice de modularité motif (particulièrement, le triangle), et nous utilisons l'algorithme de décomposition et d'optimisation spectrale pour détecter les communautés basées sur des motifs. Nous montrons l'apport des communautés basées sur les motifs en appliquant notre algorithme sur des réseaux sociaux connus dans la littérature et en comparant les communautés basées sur les motifs trouvées avec les communautés classiques.

  • Titre traduit

    Community detection and analysis in networks


  • Résumé

    The study of the sub-structure of complex networks is of major importance to relate topology and functionality. Understanding the modular units (communities) of graphs is of utmost importance to grasping knowledge about the functionality and performance of such systems. A community is defined as a group of nodes such that connections between the nodes are denser than connections with the rest of the network. Generally, the members of one community share the same interest. Many efforts have been devoted to the analysis of the modular structure of networks. The most of these works are grouped into two parts: community detection and community analysis. Community detection consists on finding communities in networks whithout knowing there size and number. While the community analysis deals the study of the structural and semantic properties of the emerged communities, and the understanding of the functionality and the performance of the network. In this thesis, we are interested on the study of the community structures in networks. We give contributions in both community analysis and community detection parts. In the community analysis part, we study the communities of communication networks and the communities in web services. On the one hand, we study the community emergence in communication networks. We propose a classification of the emerged community structures in a given network. We model the networks by graphs and we characterize them by some parameters (network size, network density, number of resources in the network, number of providers in the network, etc.). We give also a direct correlation between the network parameters and the emerged community structures. On the other hand, we study the communities in the web service logs. We aim to discover the business protocol of services (sequences of messages exchanged between the service and a client to achieve a given goal). We analyze the log files and we model them by graphs. In our final tree graph (message graph), the paths represent the conversations (communities). In the community detection part, the main goal of our contribution is to determine communities using as building blocks triangular motifs. We propose an approach for triangle community detection based on modularity optimization using the spectral algorithm decomposition and optimization. The resulting algorithm is able to identify efficiently the best partition in communities of triangles of any given network, optimizing their correspondent modularity function.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Claude Bernard. Service commun de la documentation. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.