Thèse soutenue

Diagnostic assisté par ordinateur grâce à l'apprentissage profond des anomalies oculaires à partir d'images du fond d'œil

FR  |  
EN
Auteur / Autrice : Anneke Annassia Putri Siswadi
Direction : Fabrice MériaudeauStéphanie Bricq
Type : Thèse de doctorat
Discipline(s) : Instrumentation et informatique de l'image
Date : Soutenance le 21/03/2023
Etablissement(s) : Bourgogne Franche-Comté en cotutelle avec Université de Gunadarma
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; 1991-....)
Partenaire(s) de recherche : Etablissement de préparation : Université de Bourgogne (1970-....)
Laboratoire : Imagerie et Vision Artificielle (ImVia) (Dijon)
Jury : Président / Présidente : Dro Désiré Sidibé
Examinateurs / Examinatrices : Sarifuddin Madenda
Rapporteurs / Rapporteuses : Thierry Urruty, Mathieu Lamard

Résumé

FR  |  
EN

Cette thèse présente des modèles de diagnostics médicaux assistés par ordinateurs (CAD) pour la détection d'anomalies oculaires à partir de photographies du fond d'œil. Le premier modèle CAD est mis en œuvre pour détecter les microanévrismes (MAs) avec une sensibilité élevée et un faible nombre de faux positifs. Le principal défi dans la détection des Mas basée sur des approches apprentissages profonds résulte de jeux de données fortement déséquilibrés. Nous avons proposé une détection des MAs qui se compose de trois processus principaux: le prétraitement, l'extraction des candidats MAs et la classification des MAs. Pour réduire le besoin d'un grand nombre de données (notamment de MAs), les candidats MAs sont extraits dans une approche non supervisée. Pour la classification finale, cette thèse propose deux approches, une méthode basée sur un ensemble de classifieurs et l'autre sur des classifieurs en cascade. Les expériences sont menées sur les jeux de données IDRiD et E-Ophta. Le classifieur basé sur un apprentissage en cascade atteint la sensibilité la plus élevée pour 8 FPI par rapport aux autres méthodes existantes dans la littérature. Le deuxième modèle proposé dans cette thèse est destiné à la la détection multi-étiquettes (labels) de 28 anomalies oculaires dont certaines très rares. Les anomalies oculaires rares sont généralement ignorées en raison d'un manque de caractéristiques visuelles. Pour enrichir notre modèle, nous proposons une approche associant les données linguistiques (description des pathologies) aux caractéristiques visuelles. Le modèle apprend la relation entre les caractéristiques spatiales et les caractéristiques linguistiques représentées sous forme de dictionnaire sémantique. Deux approches pour la détection multi-étiquettes avec apprentissage profond sont proposées dans cette thèse : l'apprentissage par dictionnaire sémantique basé CNN et basé Transformer. L'apprentissage du dictionnaire sémantique basé CNN se concentre sur l'apprentissage du dictionnaire sémantique avec la contrainte de représentation visuelle. Les résultats montrent que l'ajout de la modalité linguistique et la génération du dictionnaire sémantique peuvent augmenter les performances du modèle par rapport au modèle qui utilise uniquement la donnée image. La deuxième méthode proposée est construite sur la base de Transformers. Le dictionnaire sémantique agit comme la requête (query) tandis que les caractéristiques issues des images sont assignées à la clé (key) et la valeur (value). Les expérimentations sont menées sur le jeu de données RFMiD. Les résultats montrent que la méthode proposée peut atteindre un score final supérieur aux autres méthodes existantes sur l'ensemble de données test.