Thèse en cours

Compromis entre Confidentialité et Utilité dans la Prise de Décision Séquentielle dans l'incertain

FR  |  
EN
Auteur / Autrice : Achraf Azize
Direction : Philippe PreuxDebabrota Basu
Type : Projet de thèse
Discipline(s) : Informatique et applications
Date : Inscription en doctorat le 01/10/2021
Etablissement(s) : Université de Lille (2022-....)
Ecole(s) doctorale(s) : MADIS Mathématiques, sciences du numérique et de leurs interactions
Partenaire(s) de recherche : Laboratoire : INRIA - Institut national de recherche en informatique et en automatique Lille Nord Europe
Equipe de recherche : INRIA-CRIStAL

Résumé

FR  |  
EN

Le succès de l'apprentissage automatique dépend de la disponibilité d'une grande quantité de données. L'utilisation de cette énorme quantité de données suscite des inquiétudes quant à la confidentialité de ces données. Cela a conduit à des réglementations officielles comme le GDPR, et à des développements scientifiques comme la confidentialité différentielle. Bien que la confidentialité différentielle soit bien étudiée dans le cadre hors ligne, elle n'est pas encore complètement comprise pour l'apprentissage en ligne et les problèmes de prise de décision. Notre objectif est d'explorer et de comprendre la confidentialité différentielle dans l'apprentissage et la prise de décision en ligne, ce qui nous amène à l'apprentissage par renforcement. L'objectif de la thèse est de contribuer à une nouvelle théorie et à de nouveaux algorithmes qui clarifient la compréhension fondamentale de la fuite d'information dans l'apprentissage par renforcement et comment concevoir des algorithmes d'apprentissage par renforcement optimaux et différentiellement privés.