Thèse soutenue

Développement d'une infrastructure logicielle conviviale et modulaire pour des méthodes d'apprentissage profond appliquées à la segmentation de bio-images tridimensionnelles

FR  |  
EN
Auteur / Autrice : Guillaume Mougeot
Direction : Frédéric ChausseSophie DessetKatja Graumann
Type : Thèse de doctorat
Discipline(s) : Image, Système de perception, Robotique
Date : Soutenance le 08/12/2023
Etablissement(s) : Université Clermont Auvergne (2021-...) en cotutelle avec Oxford Brookes University
Ecole(s) doctorale(s) : École doctorale des sciences pour l'ingénieur (Clermont-Ferrand)
Partenaire(s) de recherche : Laboratoire : Institut Pascal (Aubière, Puy-de-Dôme) - Génétique, Reproduction et Développement (Clermont-Ferrand)
Jury : Président / Présidente : Nicolas Passat
Examinateurs / Examinatrices : David Rousseau
Rapporteurs / Rapporteuses : Nicolas Passat, Carole Frindel

Résumé

FR  |  
EN

L'émergence de l'apprentissage profond a donné un nouveau souffle à l'analyse d'images, en particulier pour la segmentation, une étape difficile mais nécessaire pour quantifier des objets bidimensionnels (2D) et tridimensionnels (3D). Malgré les promesses de l'apprentissage profond, ces méthodes ne se répandent que lentement dans le domaine de la biologie. Au cours de ce projet de thèse, le noyau 3D de la cellule est utilisé comme objet d'intérêt pour comprendre comment ses variations de forme contribuent à l'organisation du matériel génétique. Tout d'abord, une étude bibliographique a montré que très peu de méthodes disponibles publiquement pour la segmentation du noyau 3D répondent aux exigences minimales de reproductibilité. Ces méthodes ont ensuite été évaluées et seule l'une d'entre elles, appelée nnU-Net, a surpassé le meilleur outil spécialisé de vision par ordinateur. Sur la base de ces observations, une nouvelle philosophie de développement a été élaborée et, à partir de celle-ci, Biom3d, une nouvelle infrastructure logicielle pour l'apprentissage profond, a vu le jour. Biom3d est un outil convivial utilisé avec succès par les biologistes impliqués dans la segmentation des noyaux 3D et offrant une nouvelle alternative pour mesurer automatiquement et avec précision les paramètres morphologiques des noyaux. Bien optimisé, Biom3d surpasse également les performances des méthodes de pointe sur une grande variété de problèmes de segmentation biologique et médicale. Modulaire, Biom3d est un cadre durable compatible avec les dernières innovations en matière d'apprentissage profond, telles que les méthodes auto-supervisées. L'auto-supervision vise à répondre au besoin important en annotation manuelle des méthodes d'apprentissage profond, en pré-entraînant les modèles sur de grands ensembles de données non annotées pour extraire des connaissances a priori avant de les réentraîner sur des ensembles de données annotées. Dans ce travail, une approche auto-supervisée basée sur le pré-entraînement d'un modèle U-Net entier avec les fonctions de coût Triplet et Arcface est développée et démontre des améliorations significatives par rapport aux méthodes supervisées au regard de la segmentation 3D. La performance, la modularité et la nature interdisciplinaire des outils développés au cours de cette thèse serviront de plateforme d'innovation pour un large panel d'utilisateurs allant des utilisateurs biologistes aux futurs développeurs de méthodes d'apprentissage profond.