Représentations parcimonieuses en apprentissage statistique, traitement d’image et vision par ordinateur
Auteur / Autrice : | Julien Mairal |
Direction : | Francis Bach, Jean Ponce |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 30/11/2010 |
Etablissement(s) : | Cachan, Ecole normale supérieure |
Ecole(s) doctorale(s) : | École doctorale Sciences pratiques (1998-2015 ; Cachan, Val-de-Marne) |
Jury : | Examinateurs / Examinatrices : Éric Moulines, Guillermo Sapiro, Jean-Philippe Vert |
Rapporteur / Rapporteuse : Stéphane Mallat, Bruno A. Olshausen |
Mots clés
Mots clés contrôlés
Résumé
Nous étudions dans cette thèse une représentation particulière de signaux fondée sur une méthode d’apprentissage statistique, qui consiste à modéliser des données comme combinaisons linéaires de quelques éléments d’un dictionnaire appris. Ceci peut être vu comme une extension du cadre classique des ondelettes, dont le but est de construire de tels dictionnaires (souvent des bases orthonormales) qui sont adaptés aux signaux naturels. Un succès important de cette approche a été sa capacité à modéliser des imagettes, et la performance des méthodes de débruitage d’images fondées sur elle. Nous traitons plusieurs questions ouvertes, qui sont reliées à ce cadre : Comment apprendre efficacement un dictionnaire ? Comment enrichir ce modèle en ajoutant une structure sous-jacente au dictionnaire ? Est-il possible d’améliorer les méthodes actuelles de traitement d’image fondées sur cette approche ? Comment doit-on apprendre le dictionnaire lorsque celui-ci est utilisé pour une tâche autre que la reconstruction de signaux ? Y a-t-il des applications intéressantes de cette méthode en vision par ordinateur ? Nous répondons à ces questions, avec un point de vue multidisciplinaire, en empruntant des outils d’apprentissage statistique, d’optimisation convexe et stochastique, de traitement des signaux et des images, de vison par ordinateur, mais aussi d'optimisation sur des graphes.