Apprentissage de Représentations en Pathologie Numérique : Application à la Prédiction des Caractéristiques Moléculaires du Cancer
Auteur / Autrice : | Tristan Lazard |
Direction : | Thomas Edgar Walter, Etienne Decencière |
Type : | Thèse de doctorat |
Discipline(s) : | Bio-informatique |
Date : | Soutenance le 29/11/2023 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique (Paris) |
Partenaire(s) de recherche : | Laboratoire : Centre de bio-informatique (Fontainebleau, Seine et Marne) |
établissement de préparation de la thèse : École nationale supérieure des mines (Paris ; 1783-....) | |
Jury : | Président / Présidente : Isabelle Bloch |
Examinateurs / Examinatrices : Thomas Edgar Walter, Etienne Decencière, Jakob Nikolas Kather, Daniel Racoceanu, Jean-Philippe Vert | |
Rapporteurs / Rapporteuses : Jakob Nikolas Kather, Daniel Racoceanu |
Mots clés
Résumé
Les images de lames entières (WSI) sont des versions numérisées de coupes microscopiques de tissus colorés.Ces images remplissent plusieurs fonctions dans la prise en charge du cancer. Elles servent non seulement d'outil diagnostique de référence,mais aussi pour la stratification de patient, le sous-typage de la maladie et l'orientation vers des options de traitement personnalisés.Elles sont également utilisées pour évaluer l'efficacité des traitements et suivre leurs résultats au fil du temps.En effet, les WSI contiennent des informations biologiques complexes. On peut y trouver des centaines de milliers de cellules à travers différents types de tissusainsi que des motifs visuels allant de la texture nucléaire à l'architecture des tissus.Cette thèse se concentre sur l'utilisation de l'apprentissage automatique pour extraire l'information importante contenue dans les WSI, un processus connu sous le nom d'apprentissage de représentation.La supervision pour l'apprentissage de représentation d'images d'histopathologie peut prendre plusieurs formes, allant des étiquettes générées par lesmédecins à des mesures biologiques supplémentaires telles que les données de séquençage de l'ADN et de l'ARN.Cependant, ces signaux de supervision présentent des défis : ils peuvent être faibles, bruités, incertains et surtout, rares, car difficilement accessibles.L'objectif principal de cette thèse est donc de répondre à ces défis par le développement d'algorithmes d'apprentissage de représentationqui fonctionnent efficacement sous ces contraintes de supervision.Nous y détaillerons des contributions de plusieurs natures, allant du développement de nouveaux algorithmes d'interprétabilité à l'introductiond'un nouveau cadre d'apprentissage auto-supervisé conçu spécifiquement pour l'apprentissage de représentation de WSI.Finalement, chacune de ces avancées seront présentées dans le cadre de la résolution de tâches de classification de WSI, basées sur des données moléculaires et ayant une importance clinique significative.