Thèse soutenue

Réseaux de neurones sur graphes : analyse et contributions

FR  |  
EN
Auteur / Autrice : Guillaume Renton
Direction : Sébastien Adam
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 08/07/2021
Etablissement(s) : Normandie
Ecole(s) doctorale(s) : École doctorale mathématiques, information et ingénierie des systèmes (Caen)
Partenaire(s) de recherche : Etablissement de préparation de la thèse : Université de Rouen Normandie (1966-....)
Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...)
Jury : Examinateurs / Examinatrices : Sébastien Adam, Josep Llados i Canet, Jean-Yves Ramel, Nicolas Thome, Luc Brun, Pierre Héroux, Benoît Gaüzère, Élisa Fromont
Rapporteurs / Rapporteuses : Josep Llados i Canet

Résumé

FR  |  
EN

Bien que théorisés il y a une quinzaine d’années, l’intérêt de la communauté scientifique pour les réseaux de neurones sur graphes n’a connu un réel essor que très récemment. De tels modèles visent à transposer les capacités d’apprentissage de représentation inhérentes aux réseaux de neurones profonds sur des données de type graphes, via l’apprentissage d’états cachés associés aux nœuds du graphe. Ces états cachés sont calculés et mis à jour en fonction des informations contenues dans le voisinage de chacun des nœuds. Ce récent intérêt pour les réseaux de neurones sur graphes (GNN) a conduit à une "jungle" de modèles et de méthodes, rendant le domaine de recherche parfois confus. Historiquement, deux principales stratégies ont été explorées : les réseaux spatiaux et les réseaux spectraux. Les réseaux spatiaux, parfois appelés "message passing neural network", sont basés sur le calcul d’un message agrégeant l’information contenue dans le voisinage de chacun des nœuds. Ce message est ensuite utilisé afin de mettre à jour les états cachés des différents nœuds du graphe. Les réseaux spectraux quant à eux sont basés sur la théorie spectrale des graphes et reposent donc sur le Laplacien du graphe. La décomposition en valeurs/vecteurs propres du Laplacien permet notamment de définir une transformée de Fourier sur graphe ainsi qu’une transformée inverse. À partir de ces transformées, différents filtrages peuvent être appliqués sur le graphe, obtenant des résultats similaires au filtrage sur une image ou sur un signal. Dans cette thèse, nous commençons par introduire une troisième catégorie, appelée spectral-rooted spatial convolution. En effet, certaines méthodes récentes prennent racine dans le domaine spectral tout en évitant le calcul de la décomposition en vecteurs propres du Laplacien. Cette troisième catégorie nous amène à nous poser la question de la différence fondamentale entre les réseaux de neurones spatiaux et réseaux de neurones spectraux. Nous répondons à cette question par la proposition d’un modèle général unifiant les deux stratégies, montrant notamment que les modèles spectraux sont un cas particulier des modèles spatiaux. Ce cadre unifié nous a par ailleurs permis de proposer une analyse spectrale de plusieurs modèles de GNN populaires dans la communauté scientifique, à savoir GCN, GIN, GAT, Chebnet et CayleyNet. Cette analyse montre que les modèles spatiaux sont limités aux filtrages passe-bas et passe haut, tandis que les modèles spectraux sont capables de réaliser n’importe quel type de filtres. Ces résultats sont ensuite retrouvés avec la présentation d’un problème jouet, montrant dans un premier temps la limitation des modèles spatiaux à définir des filtres passe-bande et l’importance que peut revêtir l’utilisation de tels filtres.Ces résultats nous ont amenés à proposer une méthode capable de réaliser n’importe quel type de filtrage, tout en limitant le nombre de paramètres du réseau. En effet, bien que les modèles spectraux soient capables de réaliser tout type de filtrage, l’ajout d’un nouveau filtre requiert l’ajout d’une nouvelle matrice de poids dans le réseau de neurones. Afin de réduire le nombre de paramètres, nous proposons l’adaptation des Depthwise Separable Convolution aux graphes via une méthode intitulée Depthwise Separable Graph Convolution Network. Cette méthode a été évaluée à la fois en apprentissage transductif et en apprentissage inductif, et obtient des résultats supérieurs à l’état de l’art sur les datasets testés. Enfin, nous proposons une méthode définie dans le domaine spatial afin de prendre en compte les attributs d’arcs. En effet, cette problématique a été peu étudiée par la communauté scientifique, et le nombre de méthodes proposant d’inclure ces informations est très réduit.