Compromis entre Confidentialité et Utilité dans la Prise de Décision Séquentielle dans l'incertain
Auteur / Autrice : | Achraf Azize |
Direction : | Philippe Preux, Debabrota Basu |
Type : | Projet de thèse |
Discipline(s) : | Informatique et applications |
Date : | Inscription en doctorat le 01/10/2021 |
Etablissement(s) : | Université de Lille (2022-....) |
Ecole(s) doctorale(s) : | MADIS Mathématiques, sciences du numérique et de leurs interactions |
Partenaire(s) de recherche : | Laboratoire : INRIA - Institut national de recherche en informatique et en automatique Lille Nord Europe |
Equipe de recherche : INRIA-CRIStAL |
Résumé
Le succès de l'apprentissage automatique dépend de la disponibilité d'une grande quantité de données. L'utilisation de cette énorme quantité de données suscite des inquiétudes quant à la confidentialité de ces données. Cela a conduit à des réglementations officielles comme le GDPR, et à des développements scientifiques comme la confidentialité différentielle. Bien que la confidentialité différentielle soit bien étudiée dans le cadre hors ligne, elle n'est pas encore complètement comprise pour l'apprentissage en ligne et les problèmes de prise de décision. Notre objectif est d'explorer et de comprendre la confidentialité différentielle dans l'apprentissage et la prise de décision en ligne, ce qui nous amène à l'apprentissage par renforcement. L'objectif de la thèse est de contribuer à une nouvelle théorie et à de nouveaux algorithmes qui clarifient la compréhension fondamentale de la fuite d'information dans l'apprentissage par renforcement et comment concevoir des algorithmes d'apprentissage par renforcement optimaux et différentiellement privés.