Thèse soutenue

Les Défis des Applications Concrètes de la Classification d'Images à partir de Peu d'Exemples

FR  |  
EN
Auteur / Autrice : Etienne Bennequin
Direction : Marc AiguierMyriam TamiCéline Hudelot
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 19/09/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale INTERFACES : approches interdisciplinaires, fondements, applications et innovation
Partenaire(s) de recherche : Laboratoire : Mathématiques et informatique pour la complexité et les systèmes (Gif-sur-Yvette, Essonne ; 2006-....)
référent : CentraleSupélec (2015-....)
graduate school : Université Paris-Saclay. Graduate School Sciences de l'ingénierie et des systèmes (2020-....)
Jury : Président / Présidente : Stéphane Canu
Examinateurs / Examinatrices : Anissa Mokraoui, Vincent Gripon, Hervé Le Borgne, Florian Yger
Rapporteurs / Rapporteuses : Anissa Mokraoui, Vincent Gripon

Résumé

FR  |  
EN

En 2015, alors que les réseaux de neurones convolutionnels atteignaient des performances surhumaines en reconnaissance d'image à grande échelle, la communauté a commencé à observé que ces performances peinaient à se reproduire avec de petits volumes de données. Les algorithmes d'apprentissage profond présentaient de faibles résultats lorsqu'on leur demandait de classifier des images parmi des classes pour lesquelles on ne leur fournissait qu'une poignée d'exemples, à l'inverse de la capacité des humains à reconnaître de nouveaux concepts à partir de très peu d'exemples. Ainsi, un nouveau domaine de recherche apparut dans le paysage de l'apprentissage machine : le Few-Shot Learning, ou apprentissage à partir de peu de données. Au sein de ce nouveau domaine, nous avons rapidement développé des algorithmes dédiés, construit des jeux de données et établi de nombreuses règles et configurations restrictives pour évaluer les modèles d'apprentissage à partir de peu de données. Si ce procédé d'abstraction s'est montré très propice à des comparaisons faciles et des itérations rapides, il a également restreint la recherche en apprentissage à partir de peu d'exemples à la résolution d'un problème hypothétique, par de nombreux aspects non représentatif des problèmes industriels réels que nous avons rencontrés à Sicara. Dans cette thèse, nous mettons en évidence plusieurs divergences entre la recherche académique et les applications réelles de l'apprentissage à partir de peu d'exemples, et nous proposons des contre-mesures pour réduire cet écart.Tout d'abord, la configuration standard de la classification d'images à partir de peu d'exemples suppose que les quelques exemples d'images disponibles (l'ensemble support) sont issues de la même distribution que les images à classifier (l'ensemble des requêtes). En réalité, cette hypothèse est souvent contredite, lorsque l'ensemble support correspond à des images acquises dans un environnement contrôlé (par exemple le catalogue d'un site de e-commerce) tandis que les images requêtes sont plus chaotiques (par exemple des photographies prises par des utilisateurs individuels). Nous formalisons ce problème pour la première fois, et proposons des jeux de données et des procédés d'évaluation dédiés, ainsi qu'une première méthode pour faciliter les efforts de recherche.Par ailleurs, dans de nombreuses applications, nous ne pouvons pas assurer que les images requêtes appartiennent effectivement aux classes définies dans l'ensemble support. Ce problème était déjà abordé dans des précédents travaux, mais les méthodes complexes développées pour ce problème ne montraient pas d'incrément notable par rapport à des méthodes naïves. Dans cette thèse, nous mettons à profit l'ensemble des requêtes par une approche simple et raisonnée pour atteindre des performances utilisables en reconnaissance à partir de peu d'exemples dans un ensemble ouvert.Enfin, nous avons observé que dans les bancs de test les plus populaires dans la recherche académique, les modèles étaient chargés de classifier parmi des classes correspondant à des concepts très distants, comme distinguer une tarte d'un serpent. A l'inverse, la plupart des applications du monde réel impliquent une distinction entre des concepts très proches : des bactéries d'autres bactéries, des outils d'autres outils, ou des composants électroniques d'autres composants électroniques. Dans cette thèse, nous proposons une nouvelle méthode d'évaluation pour résoudre ces biais.