Approche d'apprentissage en profondeur pour la segmentation sémantique d'images pathologiques
Auteur / Autrice : | Yanbo Feng |
Direction : | Hélène Laurent, Adel Hafiane |
Type : | Projet de thèse |
Discipline(s) : | Sciences et Technologies Industrielles |
Date : | Soutenance en 2022 |
Etablissement(s) : | Bourges, INSA Centre Val de Loire |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire ; 2012-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Pluridisciplinaire de recherche en ingénierie des systèmes, mécanique et énergétique (Orléans ; 2008-....) |
Jury : | Examinateurs / Examinatrices : Hélène Laurent, Su Ruan, Olivier Lezoray, Adel Hafiane, Abbas Cheddad, Fabrice Meriaudeau |
Rapporteur / Rapporteuse : Su Ruan, Olivier Lezoray |
Résumé
L'analyse et l'interprétation d'images biomédicales est un sujet de recherche précieux. L'analyse de l'image pathologique est une phase indispensable dans le diagnostic et le classement du cancer. En particulier, la segmentation de l'image pathologique pour l'analyse quantitative du volume tissulaire, la localisation des tissus pathologiquement altérés, la planification du traitement et d'autres tâches. Dans ce travail de recherche, nous avons étudié l'approche d'apprentissage en profondeur pour la segmentation sémantique de l'image de diapositive entière pathologique (WSI) qui a une résolution énorme généralement avec des gigapixels. Dans un premier temps, nous avons mené une étude comparative des méthodes de segmentation en réseau profond des images pathologiques. Huit réseaux de neurones à convolution complète (FCNN) ont été comparés dans la segmentation des noyaux dans l'image du cancer du sein, de la glande dans l'image colorectale et de la zone cancéreuse dans l'image du cancer du foie. Les structures et les éléments des réseaux ont été discutés en profondeur, ce qui a été précieux pour la conception du réseau et l'étude ultérieure. Deuxièmement, nous avons proposé une nouvelle méthode basée sur une approche multi-échelle avec apprentissage en profondeur et apprentissage d'ensemble pour segmenter les zones d'intérêt dans des images de diapositives entières. Nous avons construit un modèle pyramidal de WSI, où les U-Nets ont été formés individuellement à chaque niveau, puis les différentes segmentations obtenues ont été fusionnées pour le résultat final. Troisièmement, nous avons proposé un cadre de bout en bout faiblement supervisé pour la segmentation sémantique de la zone cancéreuse. Ce travail fournit une solution alternative pour utiliser le réseau de neurones à convolution pour réaliser une segmentation au niveau des pixels et résoudre l'annotation insuffisante au niveau des pixels utilisée dans FCNN. Quatrièmement, nous nous sommes concentrés sur l'interprétabilité de l'architecture des réseaux de neurones profonds. Les poids de la couche de sortie ont été extraits et analysés ; les cartes des caractéristiques ont été visualisées. Grâce à des expériences, il a été constaté que la catégorie de carte de caractéristiques a une faible relation avec les poids, tandis que les canaux fixes peuvent produire une carte de caractéristiques avec des caractéristiques spécifiques. Cette conclusion peut être intéressante pour optimiser et comprendre les réseaux. Dans cette thèse, l'approche d'apprentissage en profondeur a été étudiée et utilisée dans les cadres de l'apprentissage supervisé, de l'apprentissage faiblement supervisé, en plus des méthodes d'apprentissage d'ensemble et de traitement d'images. L'ensemble du travail fournit une référence précieuse pour la segmentation des images pathologiques.