Étude des propriétés et modélisation de graphes sociaux complexes
Auteur / Autrice : | Thibaud Trolliet |
Direction : | Frédéric Giroire |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 25/06/2021 |
Etablissement(s) : | Université Côte d'Azur |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....) |
Partenaire(s) de recherche : | Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) |
Jury : | Président / Présidente : Clémence Magnien |
Examinateurs / Examinatrices : Frédéric Giroire, Clémence Magnien, Christophe Crespelle, Jean-Loup Guillaume, Augustin Chaintreau, Giovanni Neglia, Pawel Pralat | |
Rapporteur / Rapporteuse : Christophe Crespelle, Jean-Loup Guillaume |
Mots clés
Résumé
L'émergence rapide des réseaux sociaux lors des deux dernières décennies, leur impact majeur sur la société actuelle, ainsi que l'accès récent à de grandes quantités de données les concernant, a amené un fort attrait pour l'étude des réseaux complexes. De nombreux modèles de graphes aléatoires ont été proposé afin de reproduire ces réseaux et leurs propriétés - faible diamètre, distribution des degrés en loi de puissance, présence de communautés… Cependant, du fait de la complexité de l'étude théorique de leurs propriétés, les modèles proposés sont souvent conçus pour des graphes non orientés et se concentrent sur l'émergence d'une ou deux propriétés à la fois.Cette thèse a pour but de développer des modèles de graphes aléatoires suffisamment généraux pour reproduire de nombreuses propriétés complexes observées dans les réseaux du monde réel. En particulier, nous présentons des modèles permettant de construire des graphes avec des distributions de degrés quelconques, des graphes dirigés avec un haut coefficient de clustering, et des hypergraphes avec distribution de degrés en loi de puissance et une forte présence de communautés. Nous étudions analytiquement et expérimentalement les propriétés des modèles présentées. Nous développons enfin un outil utilisant les chaînes de Markov pour calculer la distribution des degrés de modèles d'attachement préférentiel.Afin de s'aider dans la construction de ces modèles, nous étudions dans cette thèse deux réseaux complexes de grande taille : un graphe dirigé de l'ensemble des liens d'abonnements sur le réseau social Twitter, avec 505 millions de comptes et 23 milliards d'abonnements ; et un hypergraphe de co-publications scientifiques extraites de la base de données Scopus, contenant 2.2 millions d'auteurs distincts et 3.9 millions de publications. Des propriétés atypiques émergent de l'étude de ces deux graphes, provenant en particulier de leur caractère dirigé et d'hypergraphe, et qu'aucun modèle de la littérature ne permettait jusqu'alors de reproduire.