Thèse soutenue

Communautés et anonymisation dans les graphes

FR  |  
EN
Auteur / Autrice : Pierre Cazals
Direction : Cristina Bazgan
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 10/12/2021
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale SDOSE (Paris)
Partenaire(s) de recherche : établissement opérateur d'inscription : Université Paris Dauphine-PSL (1968-....)
Laboratoire : Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision (Paris)
: École nationale supérieure des mines (Paris ; 1783-....)
Jury : Président / Présidente : Nadia Brauner
Examinateurs / Examinatrices : Cristina Bazgan, Nadia Brauner, Éric Angel, Cédric Bentz, Florent Foucaud
Rapporteurs / Rapporteuses : Éric Angel, Cédric Bentz

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Dans cette thèse nous étudions la complexité algorithmique de problèmes d’optimisation liés à l’étude des réseaux sociaux. Un réseau social peut être modélisé par un graphe dans lequel les sommets représentent les membres et les arêtes, leurs relations. Nous nous intéressons à deux problématiques différentes, l’anonymisation de graphes et la détection de communautés. L’anonymisation de graphes a déjà été étudiée et de nombreuses formalisations du concept ont été proposées sous forme de propriétés. Pour les satisfaire, il faut souvent transformer le graphe initial. On sera alors attentif à fournir des algorithmes qui minimisent son altération lors du processus d’anonymisation. Dans cette thèse nous mesurons l’altération subie par le nombre de transformations élémentaires effectuées sur le graphe. Nous proposons d’étudier la minimisation du nombre de rotations d’arêtes nécessaires sur un graphe afin que celui-ci respecte une propriété d’anonymisation donnée dans différents cas de figure. Des travaux empiriques ont déjà été publiés et nous nous sommes attachés à les poursuivre sous l’angle de la complexité et de l’approximation. L’utilisation de ce nouvel opérateur a permis des résultats théoriques négatifs ainsi que positifs, l’ensemble étant plus encourageant que les résultats sur les précédents opérateurs. Une communauté est un groupe social partageant un espace, des biens ou des intérêts communs. Cela se reflète sur le graphe par des fortes connexions entre ses individus. Il existe de nombreuses manières de caractériser les communautés et nous nous sommes concentrés sur les définitions basées sur l’optimisation d’une fonction de densité. Plus précisément nous étudions un problème de partition en sous-graphes denses où l’on cherche à maximiser une fonction de densité globale. Nous poursuivons les premiers travaux entrepris sur ce sujet et proposons des résultats plus approfondis.