Thèse soutenue

Sélection de biomarqueurs basée sur l'IA pour prédire la réponse au traitement du cancer du poumon

FR  |  
EN
Auteur / Autrice : Paul Tourniaire
Direction : Hervé DelingetteNicholas Ayache
Type : Thèse de doctorat
Discipline(s) : Automatique, traitement du signal et des images
Date : Soutenance le 12/06/2023
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes)
Jury : Président / Présidente : Laure Blanc-Féraud
Examinateurs / Examinatrices : Hervé Delingette, Nicholas Ayache, Laure Blanc-Féraud, Hugues Talbot, Elsa D. Angelini, Paul Hofman, Maria Vakalopoulou, Nasir Rajpoot
Rapporteur / Rapporteuse : Hugues Talbot, Elsa D. Angelini

Résumé

FR  |  
EN

L'objectif de cette thèse est de développer des modèles d'apprentissage automatique capables d'exploiter des lames histologiques et des données cliniques pour prédire le résultat des traitements par immunothérapie contre le cancer du poumon. À cette fin, plusieurs défis doivent être relevés, tels que la classification et la localisation simultanées d'informations dans des images de lames entières de grande taille, ou l'interprétation des prédictions faites par les modèles. Dans ce qui suit, nous proposerons plusieurs contributions pour relever ces défis.Le chapitre 2 introduit le concept de supervision mélangée en histopathologie. L'objectif de cette méthode est de tirer parti de plusieurs niveaux de supervision (c'est-à-dire la supervision globale et locale) pour rendre le modèle plus efficace à la fois en classification et en localisation. Sur la base d'un modèle d'apprentissage profond basé sur l'attention et adapté à la classification globale et locale de tissu dans des coupes histologiques, nous montrons qu'il est possible d'améliorer non seulement les performances du modèle en matière de classification des lames, mais aussi et surtout sa capacité à localiser avec précision les régions d'intérêt dans le tissu disponible, lorsque seules quelques annotations disponibles.Le chapitre 3 étend le travail présenté dans le chapitre 2, en consolidant les branches de classification et de localisation simultanées du modèle avec des fonctions de coût adaptées qui contraignent la distribution de l'attention à suivre la distribution réelle des labels d'après les annotations disponibles. Une stratégie d'échantillonnage des images est également proposée pour renforcer les performances de localisation et simplifier la procédure d'apprentissage afin qu'elle s'inscrive dans un processus unique.Dans le chapitre 4, nous présentons un ensemble de données multicentriques sur le cancer du poumon dédié à la prédiction de la réponse à l'immunothérapie. Nous documentons les différentes étapes suivies pour éliminer les échantillons de faible qualité, ainsi que les cas indéterminés, et nous discutons de la définition de ce qu'est une réponse positive ou négative par rapport aux évaluations cliniques actuelles de référence. Enfin, nous évaluons plusieurs modèles permettant de prédire directement la réponse au traitement à partir de lames histologiques et discutons des écueils des approches envisagées.Dans le chapitre 5, nous passons de la prédiction binaire de la réponse au traitement à la prédiction de survie, et nous utilisons l'apprentissage par contraste ainsi que le regroupement non paramétrique profond pour générer un ensemble de caractéristiques pronostiques de manière non supervisée. Nous montrons que l'ensemble des caractéristiques obtenu est un puissant indicateur de survie et qu'il conserve un bon niveau de performance lorsque l'on choisit un seul centre comme ensemble de test. Nous discutons également de l'interprétation histologique faite du résultat de l'algorithme de regroupement, en particulier pour les groupes les plus corrélés à la survie.Pour conclure, nous abordons les questions et les défis en suspens, et nous discutons des orientations futures qui pourraient être prises afin de répondre aux questions restées sans réponse.