Inférence causale par apprentissage multi-groupes
| Auteur / Autrice : | Hanqi Sun |
| Direction : | Gilles Stoltz, Evgenii Chzhen |
| Type : | Projet de thèse |
| Discipline(s) : | Mathématiques appliquées |
| Date : | Inscription en doctorat le 01/10/2025 |
| Etablissement(s) : | université Paris-Saclay |
| Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire de Mathématiques d'Orsay |
| Equipe de recherche : Probabilités et statistiques (LMO) | |
| Référent : Faculté des sciences d'Orsay |
Mots clés
Résumé
Ce projet de doctorat aborde le problème de la stratification cachée dans l'apprentissage statistique et l'apprentissage séquentiel. Il vise à comprendre comment des structures de sous-groupes non observées influencent les résultats de l'apprentissage, et comment y remédier à travers le prisme de l'inférence causale. L'idée centrale est de concevoir des algorithmes d'apprentissage performants lorsqu'évalués sur des sous-populations latentes. Le projet commence par l'apprentissage multi-groupes en mode « batch » (avec toutes les données disponibles d'un coup), en analysant l'excès de risque pour des sous-groupes connus et en améliorant les techniques existantes : notamment, en évitant les conversions séquentiel vers-batch (qui sont trop « boîte noire ») et en proposant à leur place des alternatives interprétables et pratiques. Le projet explore également l'apprentissage dans des contextes de groupes structurés, tels que les structures hiérarchiques ou en grille, avec pour objectif de développer des algorithmes simples et optimaux, accompagnés de garanties théoriques. Il s'étend ensuite à l'apprentissage séquentiel et examine la minimisation du regret au niveau des groupes, dans des contextes d'observations « bandits » et/ou avec un vu d'échantillonnage actif.