Résolution de problèmes d'optimisation combinatoire par des méthodes hybrides combinant des techniques d'apprentissage automatique à des techniques existantes
Auteur / Autrice : | Fulin Yan |
Direction : | Francois Clautiaux |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques appliquées et calcul scientifique |
Date : | Inscription en doctorat le 14/03/2023 |
Etablissement(s) : | Bordeaux |
Ecole(s) doctorale(s) : | École doctorale de mathématiques et informatique |
Partenaire(s) de recherche : | Laboratoire : IMB - Institut de Mathématiques de Bordeaux |
Equipe de recherche : Optimisation Mathématique Modèle Aléatoire et Statistique |
Mots clés
Résumé
Cette thèse étudiera comment l'interaction entre l'apprentissage automatique et les techniques d'optimisation existantes peut aider à calculer des solutions de 'bonne qualité' à des problèmes pouvant être exprimés comme des ensembles de processus de décision séquentiels (PDS), c'est-à-dire décrits comme une succession de prises de décision basées sur l'état courant d'un système. Au formalisme PDS est associé une représentation du problème (ou d'un sous-problème de celui-ci) sous la forme d'un graphe représentant les états du système et les transitions possibles entre ces états. Une partie du travail consistera à identifier les modèles de réseaux neuronaux les plus pertinents pour être utilisés conjointement avec des méthodes d'optimisation afin de construire des solutions heuristiques pour des PDS. Les axes à explorer porteront notamment sur l'utilisation de modèles d'apprentissage automatique pour aider à réduire la taille du problème en apprenant une représentation graphique plus grossière de celui-ci, pour définir les caractéristiques pertinentes des noeuds et des arcs du graphe associé, ou bien encore pour détecter les décisions menant à des solutions de bonne qualité. De par la structure des problèmes à résoudre et de l'impossibilité d'obtenir des données d'entraînement labellisés en quantité suffisante, l'utilisation de techniques d'apprentissage par renforcement sera mise en uvre. La méthodologie de recherche se basera sur une comparaison entre les méthodes hybrides développées et l'état de l'art des méthodes traditionnelles en optimisation combinatoire. La comparaison prendra en compte la qualité des solutions proposées par les différentes méthodes mais aussi le temps de calcul nécessaire à l'obtention de ces solutions. Les performances de ces méthodes seront évaluées à la fois sur des instances des problèmes générés automatiquement mais seront aussi évalués, dans la mesure du possible, sur des instances de problèmes industriels réels, ce qui permettra d'évaluer au mieux la pertinence de ces méthodes à ce type de problématiques. Dans un premier temps, nous nous concentrerons sur la résolution de problèmes qui peuvent être formulés comme un processus de décision séquentiel (PDS) avec des contraintes linéaires supplémentaires liées à la consommation totale de ressources dans toute séquence de décisions. Nous supposons que nous avons une formulation récursive du problème implicitement définie par un multi-graphe acyclique dirigé (c'est-à-dire que nous n'avons pas accès à la définition compacte du problème). D'une part, les heuristiques basées sur des algorithmes de labels tronqués et des méthodes de recherche arborescente seront étudiées, et l'impact des méthodes d'apprentissage pour améliorer ces heuristiques sera évalué. D'autre part, nous évaluerons la capacité de l'apprentissage automatique à permettre de mieux paramétrer les techniques d'expansion de l'espace d'état. Dans l'idéal, cette thèse permettra le développement d'un algorithme permettant de construire des solutions réalisables de qualité pour un problème défini uniquement par une formulation récursive (c'est à dire sans passer par la construction de relaxation du graphes d'états). Dans un deuxième temps, nous étudierons le cas où plusieurs PDS sont considérés simultanément et connectés par des contraintes. Il s'agira de généraliser les résultats obtenus dans la première partie sur les chemins à des solutions composées d'ensembles de chemins.