Réseaux de neurones génératifs pour la résolution du problème de pré-image
Auteur / Autrice : | Clement Gledel |
Direction : | Paul Honeine |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 13/10/2023 |
Etablissement(s) : | Normandie |
Ecole(s) doctorale(s) : | École doctorale mathématiques, information et ingénierie des systèmes (Caen) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...) |
établissement co-accrédité : Université de Rouen Normandie (1966-....) | |
Jury : | Président / Présidente : Luc Brun |
Examinateurs / Examinatrices : Luc Brun, Hachem Kadri, Romain Raveaux, Benoît Gaüzère, Cécile Capponi | |
Rapporteur / Rapporteuse : Hachem Kadri, Romain Raveaux |
Mots clés
Mots clés contrôlés
Résumé
Que ce soit en reconnaissance des formes ou en apprentissage machine, il est courant de définir un espace de caractéristiques dans lequel les représentations des données sont obtenues en appliquant une transformation non-linéaire ou implicite.Cependant, cette transformation manque souvent d'interprétabilité en raison de l'accès limité à l'espace de caractéristiques.Par conséquent, il peut être fortement souhaitable de représenter, dans l'espace des observations, des éléments de l'espace de caractéristiques.Néanmoins, l'obtention de la transformation inverse est une tâche difficile qui implique la résolution du problème de pré-image.Cette tâche devient d'autant plus difficile lorsqu'il s'agit de données structurées telles que les graphes, qui sont complexes et discrets par nature.Dans cette thèse, nous proposons plusieurs approches cherchant à résoudre le problème de pré-image grâce à l'application de modèle génératif profond.Pour ce faire, nous commençons par introduire les concepts essentiels qui constituent nos contributions.Ces concepts comprennent le problème de pré-image et les méthodes d'apprentissage machine, en particulier les noyaux, les modèles d'apprentissage profond, ainsi que les différentes approches génératives basées sur les réseaux de neurones.À partir de cette analyse, nous proposons l'utilisation de modèle génératif profond appelé Normalizing Flows (NF), qui se révèle particulièrement adapté à notre problématique.Ce choix est motivé par la propriété d'inversibilité exacte offerte par les NF.De cela, nous introduisons une première approche qui a pour objectif de résoudre le problème de pré-image rencontré lors de l'utilisation de noyau.Cette méthode repose sur l'alignement de l'espace de caractéristiques implicitement généré par le noyau avec l'espace latent généré par un NF.Ce modèle étant inversible par nature, le problème de pré-image associé au noyau peut être considéré résolu par sa transposition vers l'espace généré par le NF.Notre contribution suivante vise à proposer un formalisme général permettant la définition de méthodes d'apprentissage machine exemptes du problème de pré-image.Pour ce faire, nous proposons d'adapter l'apprentissage d'un NF, de manière non supervisée, qui, à partir d'une distribution de données complexe, permet la génération d'un espace de représentation dans lequel les données suivent une distribution prédéfinie.Combiné aux notions de projection par analyse en composantes principales, nous définissons deux méthodes de débruitage travaillant dans l'espace généré.De plus, l'inversibilité de chaque transformation permet la génération de nouvelles données à partir de points d'intérêt de l'espace latent, ce qui permet de résoudre le problème de pré-image.Ainsi, basé sur ce formalisme insensible au problème de pré-image, nous présentons deux spécifications traitant deux tâches différentes.Pour chacune de ces tâches de prédiction, à savoir classification et régression, nous proposons une méthode d’apprentissage supervisée permettant la définition d'un modèle prédictif incluant la fonction de calcul de la pré-image de tout point de l’espace de caractéristiques généré.Un chapitre présente l'application de ses approches sur des données vectorielles et d'images.Enfin, nous nous intéressons à leurs applications sur des données structurées de type graphe.Ces données complexes et discrètes sont présentes dans de nombreux domaines permettant la modélisation de relation entre entités.Par exemple, les graphes sont utilisés en bio-informatique pour représenter des molécules composées de liaisons entre atomes.Ainsi, nous proposons d'étendre nos approches supervisées à ce type de données par l'utilisation de NF de graphe.Ceci permettant la génération d'un espace de représentation continu de graphe dans lequel des opérations et méthodes d'apprentissage machine peuvent être appliquées tout en permettant le calcul de graphe pré-image grâce à l'inversibilité de notre modèle.