Contributions à l'apprentissage de représentations en vision par ordinateur et télédétection
| Auteur / Autrice : | Paul Berg |
| Direction : | Nicolas Courty, Minh Tân Pham |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance le 13/12/2024 |
| Etablissement(s) : | Lorient |
| Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication en Bretagne Océane (Brest) |
| Partenaire(s) de recherche : | Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) |
| Jury : | Président / Présidente : David Picard |
| Examinateurs / Examinatrices : Ewa Kijak | |
| Rapporteurs / Rapporteuses : Dino Ienco, Loïc Landrieu |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L'apprentissage profond est devenu un outil incontournable pour la résolution de tâches d’analyse d'images, notamment dans le domaine de la télédétection. En conséquence, les besoins en don- nées annotées ont considérablement augmenté. Cependant, l'annotation de données peut être coûteuse en temps et en moyens. Ainsi, tout un champ de la littérature s'intéresse à l'apprentissage de représentations d'images en réduisant la dépendance aux annotations par des méthodes dites autosupervisées. Les représentations apprises sont ensuite exploitables pour des tâches de vision grâce à leur nature discriminante par rapport aux labels de la tâche finale. Dans ce contexte, nous évaluons dans cette thèse comment ces méthodes peuvent être exploitées dans le domaine de la télédétection en s'intéressant à des tâches telles que la classification de scène multimodale pour laquelle nous proposons une méthode d'apprentissage autosupervisé. Nous mettons à profit le problème du transport optimal pour modéliser certains problèmes et proposer des contributions méthodologiques à l'apprentissage contrastif. Finalement, nous proposons d'aller au-delà des es- paces Euclidiens pour l'apprentissage de représentation en proposant une méthode de classifica- tion dans les espaces hyperboliques. Notre méthode qui est informée par la hiérarchie du jeu dedonnées permet d'améliorer les performances en classification hiérarchique.