Thèse soutenue

Rapprocher les espaces de graphes et à noyaux : une perspective de la pré-image

FR  |  
EN
Auteur / Autrice : Linlin Jia
Direction : Paul Honeine
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 09/07/2021
Etablissement(s) : Normandie
Ecole(s) doctorale(s) : École doctorale mathématiques, information et ingénierie des systèmes (Caen)
Partenaire(s) de recherche : Etablissement de préparation : Institut national des sciences appliquées Rouen Normandie (Saint-Etienne-du-Rouvray ; 1985-....)
Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...)
Jury : Président / Présidente : Sébastien Adam
Examinateurs / Examinatrices : Paul Honeine, Florence D'Alché-Buc, Donatello Conte, Francesc Serratosa, Florian Yger, Benoît Gaüzère
Rapporteurs / Rapporteuses : Florence D'Alché-Buc, Donatello Conte

Résumé

FR  |  
EN

Les graphes permettent de modéliser un large éventail de données du monde réel. Avec les progrès des méthodes d’apprentissage automatique, l’utilisation de ces méthodes sur les graphes est devenue de plus en plus intéressante au sein de la communauté scientifique. Parmi les différentes études, les problèmes de prédiction et de génération de graphes suscitent un intérêt grandissant, porté par de nombreuses applications, notamment en chemoinformatique, en analyse de réseaux sociaux et en vision par ordinateur. La flexibilité associée aux graphes possède un inconvénient majeur. Les algorithmes d’apprentissage automatique étant définis sur des données vectorielles, leur adaptation aux graphes n’est pas triviale. Il est donc important de concevoir des outils permettant d’utiliser ces méthodes d’apprentissage automatique sur les graphes. Les noyaux sur graphes sont un outil puissant pour traiter ce problème en comblant le fossé entre un espace de graphes et un espace à noyau. Inversement, étant donné un élément dans un espace à noyau, on s’intéresse à construire son homologue dans l’espace de graphes ; c’est le problème de pré- image de graphe. La résolution de ce problème ouvre la voie à de nombreuses applications prometteuses, telles que la synthèse de molécules et la conception de médicaments. Pour résoudre les problèmes susmentionnés, nous proposons dans cette thèse de nouvelles méthodes pour construire la pré-image de graphe. Tout d’abord, nous passons en revue les noyaux sur graphes basés sur des motifs linéaires, qu’on compare à des noyaux basés sur des motifs non linéaires. Des analyses théoriques et expérimentales approfondies sont présentées et trois stratégies sont proposées pour réduire la complexité de calcul et de stockage de ces noyaux. Ensuite, nous étudions la stabilité des plus récentes heuristiques de calcul de distance d’édition de graphes et proposons une méthode d’apprentissage de métrique pour optimiser les coûts d’édition utilisés par la distance d’édition de graphes pour des problèmes de régression. Les expériences montrent que notre méthode permet d’améliorer les performances de prédiction par rapport à l'état de l’art. Sur la base de ces deux travaux, nous proposons une méthode de calcul de pré-image de graphe basée sur l’apprentissage de métrique. Pour cela, l’espace de graphes, muni d’une distance d’édition de graphes, est aligné avec l’espace à noyau associé à un noyau particulier. Pour ce faire, la méthode proposée optimise les coûts d’édition afin de faire correspondre les distances dans les deux espaces. Ensuite, une estimation de la pré-image de graphe est obtenue par une méthode générative de graphe médian, configurée avec les coûts d’édition optimisés. Les expérimentations effectuées montrent que notre méthode est plus performante et plus générique que l’état de l’art. Enfin, pour aider à résoudre les problèmes susmentionnés, nous avons publié une bibliothèque en Python pour l’apprentissage automatique de graphes, comprenant l’implémentation de noyaux sur graphes, d’algorithmes de calcul de distances d’édition de graphes et de méthodes de calcul de la pré-image de graphes.