Graphes aléatoires et estimateurs semi-définis positifs.

par Lucie Neirac

Projet de thèse en Mathématiques fondamentales

Sous la direction de Guillaume Lecué et de Matthieu Lerasle.

Thèses en préparation à l'Institut polytechnique de Paris , dans le cadre de École doctorale de mathématiques Hadamard , en partenariat avec CREST - Centre de recherche en économie et statistique (laboratoire) et de Laboratoire de Statistique (equipe de recherche) depuis le 01-09-2017 .


  • Résumé

    Soient X1, ..., Xn n nœuds. On suppose que certains de ces nœuds sont connectés entre eux, de sorte qu'ils puissent être considérés comme les sommets d'un graphe. On suppose de plus qu'existent deux groupes distincts de nœuds qui présentent plus d'intra-connexion que d'inter-connections - c'est le Stochastic Bloc Model (SBM). Mais à la différence du modèle SBM classique, on suppose la présence d'outliers. Les outliers dans un graphe peuvent être par exemple : 1. des nœuds qui se comportent différemment de la majorité et sont également connectés aux deux communautés 2. des arêtes qui on été accidentellement retirées ou ajoutées au jeu de données Dans tous les cas, il est plus simple de détecter les communautés en l'absence d'outliers. Notre objectif est de construire un algorithme de détection de communautés qui soit robuste aux outliers. Nous souhaiterions adapter la méthode de Guédon et Vershynin pour en écrire une version MoM (Median of Means), et construire un algorithme associé (via une modification de l'approche Burer-Monteiro). Cela devrait pouvoir s'appliquer à d'autres problèmes, tels que le Signed clustering problem, le problème de synchronisation et le problème de ranking.

  • Titre traduit

    Random graphs and positive semi-definite estimators.


  • Résumé

    Let X1, ..., Xn be n nodes. We assume that some nodes are connected to other so that they can be seen as the vertices of a graph. We assume that there are two groups of nodes that are more connected within the groups than between the two groups - this is the classical stochastic block model (SBM). But unlike the classical framework, we believe that there are some outliers. Outliers in graph can be for instance: 1. some nodes behave very differently from the majority of other nodes (for instance they are equally connected to both two groups) 2. some edges have been added or removed accidentally from the dataset. In any case, fi nding the two communities would be easier if there was no outliers. Our aim is to construct a community detection algorithm which is robust to outliers. We would like to adapt the Guédon-Vershynin procedure to draw a MoM (Median of Means) version of it, and to design an associated algorithm (via a modi cation of the Burer-Monteiro approach ). This should extend to other problem like the signed clustering problem, the synchronization problem and the ranking problem.