Thèse soutenue

De l'importance des actions : assignation de crédit et interprétabilité pour l'apprentissage par renforcement

FR  |  
EN
Auteur / Autrice : Johan Ferret
Direction : Philippe PreuxOlivier Pietquin
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance le 04/07/2022
Etablissement(s) : Université de Lille (2022-....)
Ecole(s) doctorale(s) : Ecole doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)
Partenaire(s) de recherche : Laboratoire : Centre Inria de l'Université de Lille - Centre de Recherche en Informatique, Signal et Automatique de Lille
Jury : Président / Présidente : David Filliat
Examinateurs / Examinatrices : Amir Ofra, Théophane Weber, Matthieu Geist
Rapporteurs / Rapporteuses : David Filliat, Fabien Moutarde

Résumé

FR  |  
EN

Cette thèse, écrite pour l'obtention du doctorat en Informatique, étudie la question de l'importance individuelle des actions dans la prise de décision séquentielle, via le prisme de l'Apprentissage par Renforcement, avec diverses applications.Une découverte importante de ce travail est que deux problèmes ouverts en apparence distincts en Apprentissage par Renforcement, à savoir le problème d'assignation de crédit et l'interprétabilité, ont des solutions partielles qui impliquent des outils communs qui peuvent être vus comme des estimations de formes particulières d'importance des actions.Des algorithmes qui correspondent à des formes distinctes d'importance des actions sont proposées et étudiées empiriquement, d'un point de vue plus théorique, ou les deux.