Thèse en cours

Contributions aux réseaux de neurones sur graphes dynamiques

FR  |  
EN

Accès à la thèse

AttentionLa soutenance a eu lieu le 06/12/2024. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Leshanshui Yang
Direction : Sébastien AdamClement Chatelain
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 27/10/2021
Soutenance le 06/12/2024
Etablissement(s) : Normandie
Ecole(s) doctorale(s) : École Doctorale Mathématiques, Information, Ingénierie des Systèmes
Partenaire(s) de recherche : Laboratoire : LABORATOIRE D'INFORMATIQUE DE TRAITEMENT DE L'INFORMATION ET DES SYSTEMES
Établissement co-accrédité : Université de Rouen Normandie
Jury : Examinateurs / Examinatrices : Mathilde Vernet, Luc Brun, Clement Chatelain, Jean-yves Ramel, Nicolas Ragot, Sébastien Adam
Rapporteur / Rapporteuse : Jean-yves Ramel, Nicolas Ragot

Résumé

FR  |  
EN

Ce manuscrit présente les recherches menées dans le cadre d'une thèse CIFRE réalisée en partenariat entre le LITIS et Saagie. Les représentations à base de Graphes Dynamiques (DG), qui intègrent à la fois des informations topologiques et temporelles, sont de plus en plus utilisées pour modéliser des systèmes dynamiques tels que les réseaux sociaux, les systèmes de recommandation et les réseaux de transactions. Les réseaux de neurones sur graphes dynamiques (DGNN) sont récemment devenus l'approche à l'état de l’art dans ce domaine, avec une multitude de modèles proposés. Cependant, l'hétérogénéité et la complexité des DGs présentent des défis significatifs dans la formulation des tâches prédictives et la catégorisation des architectures DGNNs. Dans cette thèse, nous abordons d'abord le manque d'un cadre global pour définir et catégoriser les tâches prédictives sur les graphes dynamiques. Nous proposons une taxonomie qui prend en compte des facteurs tels que le graphe dynamique soit en temps discret ou en temps continu, la nature transductive ou inductive de la tâche, et la granularité de la sortie. Cette taxonomie clarifie les distinctions entre les différents contextes d'apprentissage sur les graphes dynamiques et les aligne avec les applications et jeux de données pertinents. En nous appuyant sur cette base, nous explorons la conception de modèles statistiques capables d'extraire les informations clés des graphes dynamiques. Nous introduisons une taxonomie des modèles DGNNs basée sur la manière dont ils intègrent l'information temporelle et examinons leur compatibilité avec différents contextes d'apprentissage, fournissant ainsi des pistes pour la conception et l'optimisation des DGNNs. Malgré les avancées dans la conception des DGNNs, de nombreux encodeurs de graphes ont une expressivité limitée. Les convolutions de graphes conçues spectralement, connues pour offrir une plus grande expressivité sur les graphes statiques en filtrant les valeurs propres du Laplacien pour calculer les noyaux de convolution, restent largement inexplorées sur les graphes dynamiques en temps discret (DTDG). Pour améliorer l'expressivité des DGNNs, nous introduisons le Dynamic Spectral-Parsing Graph Neural Network (DspGNN), un nouveau modèle qui optimise la convolution de graphes statiques conçue spectralement sur les DTDGs et qui répond aux défis computationnels de la décomposition spectrale sur de grands DTDGs. Les résultats expérimentaux montrent que DspGNN surpasse les modèles de référence sur les tâches de régression d'attributs d'arêtes et atteint des performances à l'état de l'art sur les tâches de prédiction de liens. Enfin, nous abordons la problématique de l'encodage des nouveaux nœuds émergents dans les graphes dynamiques sans attributs, une situation courante dans les tâches de détection d'anomalies. Nous proposons le Dual-Contextual Inductive Dynamic Graph Transformer (DCIDGT), qui capture à la fois les contextes global et local pour la détection d'anomalies. Au cœur de cette approche se trouve notre mécanisme d'Accumulative Causal Walk Alignment (ACWA), assurant l'alignement sémantique des embeddings de nœuds à travers les instantanés en résolvant le problème d'Orthogonal Procrustes. Les résultats expérimentaux montrent que DCIDGT surpasse significativement les modèles de référence dans la tâche de détection d'anomalies sur les arêtes, ouvrant de nouvelles perspectives pour gérer les nouveaux nœuds émergents ou les attributs incomplets dans les graphes dynamiques.