Apprentissage non-supervisé d'un espace de descripteurs pour le traitement d'images vidéo

par Samuel Hurault

Projet de thèse en Mathématiques appliquées et calcul scientifique

Sous la direction de Nicolas Papadakis et de Arthur Leclaire.

Thèses en préparation à Bordeaux , dans le cadre de École doctorale de mathématiques et informatique (Talence, Gironde) , en partenariat avec IMB - Institut de Mathématiques de Bordeaux (laboratoire) et de Image Optimisation et Probabilités (equipe de recherche) depuis le 01-09-2020 .


  • Résumé

    L'objectif principal de ce projet de thèse est d'étudier et de proposer de nouveaux modèles mathématiques construits, par réseaux de neurones profonds, pour la représentation de données probabiliste dans un espace latent. Dans ce contexte, on s'intéressera particulièrement aux auto-encodeurs variationnels. La difficulté majeure pour ces modèles est de démêler des corrélations apparaissant implicitement dans ces représentations fortement non-linéaires. En vue d'applications en traitement d'images vidéo, on cherchera notamment à modéliser les corrélations spatio-temporelles d'une scène dynamique. Grâce à une compréhension théorique des phénomènes probabilistes et des problèmes d'optimisations sous-jacents, on pourra proposer de nouvelles méthodes de restauration, de coloration ou de segmentation vidéo où la cohérence temporelle sera garantie par un modèle robuste.

  • Titre traduit

    Unsupervised learning of feature space for video processing


  • Résumé

    The main objective of this thesis project is to study and propose new mathematical models built, by deep neural networks, for the representation of probabilistic data in a latent space. In this context, we will be particularly interested in variational auto-encoders. The major difficulty for these models is to disentangle correlations implicitly appearing in these highly non-linear representations. In view of applications in video image processing, we will try to model the spatio-temporal correlations of a dynamic scene. Thanks to a theoretical understanding of probabilistic phenomena and the underlying optimization problems, we will be able to propose new methods of video restoration, coloring or segmentation where temporal consistency will be guaranteed by a robust model.