Exploration randomisée pour l'apprentissage par renforcement avec des garanties d'efficacite
Auteur / Autrice : | Daniil Tiapkin |
Direction : | Eric Moulines, Gilles Stoltz |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques appliquées |
Date : | Inscription en doctorat le 01/10/2023 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard |
Partenaire(s) de recherche : | Laboratoire : CMAP - Centre de Mathématiques appliquées |
Equipe de recherche : SIMPAS : Signal IMage Probabilités numériques Apprentissage Statistique |
Mots clés
Résumé
Dans le monde actuel, les systèmes d'intelligence artificielle (IA) sont développés à grande échelle, et l'apprentissage par renforcement (RL) ne fait pas exception. L'essor rapide des applications RL à grande échelle est particulièrement évident dans des secteurs cruciaux tels que la conduite autonome et la santé. Cependant, ces secteurs nécessitent non seulement une utilisation optimale des ressources, mais sont également caractérisés par des coûts d'erreur élevés, résultant souvent en perte de vies. De plus, les applications du monde réel exigent non seulement une solution optimale, mais aussi des contraintes. Pour assurer le fonctionnement stable et équitable de l'algorithme RL dans les applications pratiques, il est crucial de le soutenir avec des garanties théoriques et de la scalabilité, qui constituent les thèmes centraux de cette projet de doctorat. Le projet de recherche doctorale vise à innover en développant des algorithmes d'apprentissage par renforcement (RL) mathématiquement robustes et efficaces pour l'exploration, conçus pour une éventuelle mise en uvre à grande échelle dans des applications du monde réel. De plus, le projet prendra en compte l'équité dans le développement des algorithmes pour souligner la nécessité de créer des solutions d'IA équitables.