Apprentissage génératif à bas régime des données pour la segmentation d'images en oncologie
Auteur / Autrice : | Guillaume Sallé |
Direction : | Nicolas Boussion, Vincent Jaouen |
Type : | Thèse de doctorat |
Discipline(s) : | Analyse et traitement de l'information et des images médicales |
Date : | Soutenance le 12/06/2024 |
Etablissement(s) : | Brest |
Ecole(s) doctorale(s) : | École doctorale Sciences de la Vie et de la Santé (Rennes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de traitement de l’information médicale (Brest, Finistère) |
Jury : | Président / Présidente : Douraïed Ben Salem |
Examinateurs / Examinatrices : Nicolas Boussion, Douraïed Ben Salem, Clovis Tauber, Benjamin Lemasson, Carole Lartizien, Dimitris Visvikis | |
Rapporteurs / Rapporteuses : Clovis Tauber, Benjamin Lemasson |
Mots clés
Résumé
En apprentissage statistique, la performance des modèles est influencée par divers biais inhérents aux données, comme la rareté des données (data scarcity) et le décalage de domaine (domain shift). Cette thèse s’intéresse à réduire leur influence dans le cadre de la segmentation de structures pathologiques en imagerie médicale. En particulier, notre objectif est de réduire les écarts de données au niveau des régions d’intérêt (ROI) entre les domaines source d’entrainement et cible de déploiement, qu’ils soient intrinsèques aux données ou induits par la faible quantité de données disponibles. Dans ce but, nous proposons une stratégie d’augmentation de données adaptative, basée sur l’analyse de la distribution des intensités des ROI dans le domaine de déploiement. Une première contribution, que nous qualifions d’augmentation naïve, consiste à altérer l’apparence des ROI du domaine d’entrainement pour mieux correspondre aux caractéristiques des ROI du domaine de déploiement. Une seconde étape, complétant la première, rend l’altération plus réaliste par rapport aux propriétés du domaine cible grâce à un modèle génératif d’harmonisation one-shot, applicable dans toutes les situations de disponibilité de données. De cette façon, nous renforçons la robustesse du modèle de segmentation en aval pour les ROI dont les caractéristiques étaient initialement sous-représentées à l’entrainement. Nous évaluons notre approche à différents régimes de données et divers contextes cliniques, notamment en IRM, TDM et radiographie pulmonaire. En outre, notre approche a montré des résultats impressionnants lors d’un challenge de segmentation de tumeurs a la conférence MICCAI 2022.