Thèse soutenue

Quantification d'incertitudes au sein des réseaux de neurones : Application à la mesure automatisée de la taille de particules de TiO2

FR  |  
EN
Auteur / Autrice : Paul Monchot
Direction : Erwan Le Pennec
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 16/10/2023
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Centre de mathématiques appliquées (Palaiseau, Essonne) - Centre de Mathématiques Appliquées - Ecole Polytechnique / CMAP
Jury : Président / Présidente : Karim Lounici
Examinateurs / Examinatrices : Erwan Le Pennec, Pierre-Marc Jodoin, Sébastien Da Veiga, Mathilde Mougeot, Agnès Lagnoux
Rapporteurs / Rapporteuses : Pierre-Marc Jodoin, Sébastien Da Veiga

Résumé

FR  |  
EN

L'utilisation croissante de solutions technologiques fondées sur des algorithmes d'apprentissage profond a connu une explosion ces dernières années en raison de leurs performances sur des tâches de détection d'objets, de segmentation d'images et de vidéos ou encore de classification, et ce dans de nombreux domaines tels que la médecine, la finance, la conduite autonome ... Dans ce contexte, la recherche en apprentissage profond se concentre de plus en plus sur l'amélioration des performances et une meilleure compréhension des algorithmes utilisés en essayant de quantifier l'incertitude associée à leurs prédictions. Fournir cette incertitude est clé pour une dissémination massive de ces nouveaux outils dans l'industrie et lever les freins actuels pour des systèmes critiques notamment. En effet, fournir l'information de l'incertitude peut revêtir une importance réglementaire dans certains secteurs d'activité.Ce manuscrit expose nos travaux menés sur la quantification de l'incertitude au sein des réseaux de neurones. Pour commencer, nous proposons un état des lieux approfondi en explicitant les concepts clés impliqués dans un cadre métrologique. Ensuite, nous avons fait le choix de nous concentrer sur la propagation de l'incertitude des entrées à travers un réseau de neurones d'ores-et-déjà entraîné afin de répondre à un besoin industriel pressant. La méthode de propagation de l'incertitude des entrées proposée, nommée WGMprop, modélise les sorties du réseau comme des mixtures de gaussiennes dont la propagation de l'incertitude est assurée par un algorithme Split&Merge muni d'une mesure de divergence choisie comme la distance de Wasserstein. Nous nous sommes ensuite focalisés sur la quantification de l'incertitude inhérente aux paramètres du réseau. Dans ce cadre, une étude comparative des méthodes à l'état de l'art a été réalisée. Cette étude nous a notamment conduit à proposer une méthode de caractérisation locale des ensembles profonds, méthode faisant office de référence à l'heure actuelle. Notre méthodologie, nommée WEUQ, permet une exploration des bassins d'attraction du paysage des paramètres des réseaux de neurones en prenant en compte la diversité des prédicteurs. Enfin, nous présentons notre cas d'application, consistant en la mesure automatisée de la distribution des tailles de nanoparticules de dioxyde de titane à partir d'images acquises par microscopie électronique à balayage (MEB). Nous décrivons à cette occasion le développement de la brique technologique utilisée ainsi que les choix méthodologiques de quantification d'incertitudes découlant de nos recherches.