Monte-Carlo tree search applied to structure generation

Milo Roucairol

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Utilisation de la recherche monte-carlo pour la génération de structure

FR |

EN

Auteur / Autrice :	Milo Roucairol
Direction :	Tristan Cazenave
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 13/12/2024
Etablissement(s) :	Université Paris sciences et lettres
Ecole(s) doctorale(s) :	Ecole doctorale SDOSE (Paris)
Partenaire(s) de recherche :	établissement opérateur d'inscription : Université Paris Dauphine-PSL (1968-....)
	Laboratoire : Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision (Paris)
Jury :	Président / Présidente : Alexandre Varnek
	Examinateurs / Examinatrices : Tristan Cazenave, Alexandre Varnek, Nicolas Jouandeau, Carola Doerr
	Rapporteur / Rapporteuse : Nicolas Jouandeau, Carola Doerr

Mots clés

FR |

EN

Mots clés contrôlés

Analyse stochastique

Théorie des graphes

Monte-Carlo, Méthode de

Mots clés libres

Résumé

FR |

EN

Ce document regroupe les article publiés lors de ma thèse dirigée par Tristan Cazenave au LAMSADE. La recherche Monte Carlo désigne une classe d'algorithmes de recherche stochastiques retournant une solution avec une garantie dans le temps, mais sans garantie de résultat. Ces algorithmes utilisent des techniques d'apprentissage par renforcement basées sur des exploration aléatoires ou guidées. Les capacités des algorithmes Monte Carlo sont limitées dans des domaines d'application mis en valeur récemment, comme la génération d'image et de texte, ou les réseaux de neurones, LLM et autres algorithmes entrainés sur de larges bases de données dominent. Mais en revanche ils excellent sur les problèmes plus classiques et définis. L'usage le plus connu d'algorithme de recherche Monte Carlo est son utilisation en 2017 pour battre pour la première fois un champion de Go, chose qu'aucune autre famille d'algorithme n'était parvenue à faire. Mais les utilisations d'algorithmes de recherche Monte Carlo vont aussi bien au delà des jeux. Les algorithmes de recherche Monte Carlo sont largement utilisés dans la chimie, la recherche opérationnelle, les transports, les mathématiques, et dans les jeux. Ils peuvent être appliqués à tout problème de décision séquentielle et de recherche dans un espace d'état tant que les fonctions d'évaluation et de modification d'un état sont définies. La définition de structure pour cette thèse est ''système défini par les éléments qui le composent et les interactions entre ces éléments''. Cette thèse explore plusieurs applications de recherche Monte Carlo dans le contexte de la générationde structure. De nombreux espaces de recherche peuvent être représentés comme une structure en dehors des jeux, comme le circuit du problème de voyageur de commerce par exemple, mais aussi des molécules, des cristaux, des coalitions, des graphes, etc. Les points forts de cette thèse sont : - Des comparaisons entre algorithmes sur divers problèmes montrant la supériorité de la famille d'algorithmes ''nested''. - Une nouvelle variante de la Nested Monte Carlo Tree Search (NMCS) avec de meilleures performances. - Une bibliothèque d'algorithmes Monte Carlo codés en Rust. - Un projet de réfutation de conjectures des graphes. - Une implémentation du NMCS pour AiZynthFinder, le logiciel de rétrosynthèse open source d'AstraZeneca. - Un programme de génération de molécules valides et synthétisables. Les sujets abordés peuvent être séparés en deux groupes. D'un côté la chimie, avec le HP-model, la rétrosynthèse, etla génération de molécules. Et de l'autre les mathématiques, avec les structures de coalitions, la théorie spectrale des graphes, les réseaux de transport, et les nonograms.Bien que cette thèse ne se consacre qu'à des applications de la recherche Monte Carlo, elle apporte aussi des aperçus plus généraux : une comparaison des familles d'algorithmes montrant la supériorité des ''nested''', une nouvelle variante du NMCS, et des heuristiques et modifications généralement utiles pour les problèmes combinatoirement difficiles.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Utilisation de la recherche monte-carlo pour la génération de structure

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Utilisation de la recherche monte-carlo pour la génération de structure

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses