Applications de l’intelligence artificielle pour la caractérisation de tissus ovariens cancéreux par l’analyse : d’images de centrosomes
Auteur / Autrice : | Damien Blanc |
Direction : | Joseph Salmon |
Type : | Thèse de doctorat |
Discipline(s) : | Biostatistique |
Date : | Soutenance le 09/12/2022 |
Etablissement(s) : | Université de Montpellier (2022-....) |
Ecole(s) doctorale(s) : | École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....) |
Jury : | Président / Présidente : Thérèse Commes-Maerten |
Examinateurs / Examinatrices : Joseph Salmon, Thérèse Commes-Maerten, Aurélie Bugeau, Charles Kervrann, Benjamin Charlier, Victor Racine, Renata Basto | |
Rapporteurs / Rapporteuses : Aurélie Bugeau, Charles Kervrann |
Mots clés
Résumé
Cette thèse porte sur l’utilisation de méthodes automatiques basées sur l’intelligence artificielle dans différents contextes d’imagerie biomédicale. L’objectif principal est d’explorer dans quelle mesure des modèles d’apprentissage profond, ou Deep Learning (DL), peuvent s’implanter dans la résolution de problématiques cliniques concrètes. En particulier, nous mettons l’accent sur les modèles nommés Convolutional Neural Networks (CNNs) dont l’architecture est spécialement adaptée à la détection et à la segmentation d’objets sur des données visuelles telles que les images ou les vidéos. Dans une première partie, nous abordons ainsi la nécessité de développer des systèmes d’aides au diagnostique dans le cadre d’examen tomodensitométrique (également appelé CT-scan) pour la détection de tumeurs pulmonaires. Nous étudions ainsi les performances de l’état de l’art des modèles de détection d’objet dans un contexte en trois dimensions sur un jeu de données de plus de 1000 patients disponibles publiquement. Les résultats obtenus sur cette première étude nous ont ensuite permis de construire un outil complet d’aide au diagnostique, capable de distinguer les patients sains de ceux disposant de tumeurs. Cet outil comprends trois procédures majeures (segmentation des poumons, détections des nodules, et classification du patient) qui a permis de remporter l’édition 2019 du Data Challenge organisé par la Société Française de Radiologie (SFR). Dans la seconde partie du manuscrit, nous nous plaçons cette fois dans un cadre où la donnée, élément essentiel pour construire un modèle supervisée robuste, n’est pas ou peu disponible. Nous retrouvons fréquemment cette configuration en imagerie microscopique, où il est nécessaire d’identifier correctement chaque composant cellulaire, comme le noyau, afin de pouvoir dégager un résultat biologique d’intérêt. En alternative à un étiquetage fastidieux et couteux des pixels de chaque noyau, nous proposons une modélisation de l’ensemble des mécanismes permettant l’acquisition d’images d’échantillons biologiques. Nous obtenons ainsi un outil capable de générer rapidement, à partir d’un ensemble de paramètres prédéfinis, une grande quantité de données composées d’images simulées et d’une vérité terrain associée pour chacune d’entre elles. Enfin, nous étudions l’impact de l’utilisation de jeu de données simulées sur les performances de modèles conçus pour la segmentation de noyaux. Nous montrons ainsi qu’avec une quantité relativement faible d’image réelle, la simulation peut être utilisé comme outil d’augmentation de données et permet un gain important de performances. Enfin, la dernière partie de ce manuscrit est consacrée à l’élaboration d’une méthodologie pour la quantification de tissus ovariens cancéreux en imagerie microscopique confocale 3D. A partir d’une cohorte de 119 patientes, l’objectif principal est d’automatiser la quantification du Centrosome-Nucleus Index (CNI), et permettre ainsi de mieux comprendre le rôle que jouent les principaux organes de la cellule (dans notre contexte, le noyau et les centrosomes) dans l’évolution de la maladie. L’étude est ainsi divisée en deux tâches de comptages: d’abord des centrosomes, puis des noyaux. Le comptage visuel qui a été fait pour les centrosomes se base sur la recherche de régions colocalisées dans l’image, c’est-à-dire, des régions dont les signaux issus de différents canaux se superposent. Nous implémentons ainsi cette approche, et comparons ces performances avec des méthodes impliquant des modèles de Machine Learning ou Deep Learning. Enfin, ne disposant pas d’annotations au niveau des voxels, nous étendons notre simulateur à une troisième dimensions, et implémentons un approche d’apprentissage par renforcement afin de trouver automatiquement les paramètres de simulations permettant de donner la plus grande précision possible de comptage.