Thèse en cours

Algorithmes MCMC distribués asynchrones pour l'inférence Bayésienne en grande dimension

FR  |  
EN
Auteur / Autrice : Maxime Bouton
Direction : Pierre Chainais
Type : Projet de thèse
Discipline(s) : Traitement du signal et des images
Date : Inscription en doctorat le 24/10/2022
Etablissement(s) : Centrale Lille Institut
Ecole(s) doctorale(s) : MADIS Mathématiques, sciences du numérique et de leurs interactions
Partenaire(s) de recherche : Laboratoire : CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille
Equipe de recherche : CRIStAL-INRIA

Résumé

FR  |  
EN

Ce projet vise à accélérer les algorithmes de MCMC pour de l'inférence bayésienne rapide concernant des problèmes à grande échelle. Des applications en astronomie (comme l'imagerie hyperspectrale) ou en télédétection (comme la séparation multimodale et multi-temporelle des sources) peuvent être envisagées. Le projet fait partie de la Chaire ANR IA SHERLOCK dirigée par Pierre Chainais (cofinancée par l'ANR, l'ISITE, Centrale Lille Institut et la Région Haut-de-France). De nombreuses applications de traitement du signal et des images, allant de l'astronomie (Abdulaziz et al. 2019 ; Cai et al. 2018) à la télédétection (Borsoi et al. 2021 ; Ghamisi et al. 2019), impliquent de grandes bases de données. En l'absence de vérité terrain, l'inférence rapide des paramètres sous incertitude contrôlée est absolument nécessaire pour garantir la qualité des prédictions résultantes. Les algorithmes d'optimisation asynchrones (parallèles ou distribués) ont récemment regagné de l'intérêt en raison de leur potentiel d'accélération, par rapport à leurs homologues synchrones (Hannah et al. 2017). Cependant, les algorithmes d'optimisation n'apportent qu'une estimation ponctuelle, comme l'estimateur du maximum a posteriori (MAP). Les méthodes de Monte Carlo à chaîne de Markov (MCMC) apportent une information plus riche en échantillonnant la distribution postérieure du modèle. Les méthodes MCMC sont connues pour induire des coûts de calcul plus importants par rapport aux algorithmes d'optimisation. Néanmoins, des travaux récents à l'interface entre l'optimisation déterministe et stochastique ont introduit des échantillonneurs efficaces pour traiter des bases de données plus importantes (Durmus et al. 2018 ; Vono et al. 2020). À l'exception de (Simsekli et al. 2018 ; Terenin et al. 2020), les algorithmes de MCMC asynchrones restent largement à étudier. Ce projet de thèse vise à étudier le potentiel des algorithmes de MCMC asynchrones pour de l'inférence bayésienne rapide dans des problèmes à grandes dimensions.