Thèse soutenue

Co-analyse de données radiomiques, pathologiques, et transcriptomiques pour la compréhension et la prédiction de la réponse à l’immunothérapie chez des patients atteints de cancer du poumon non à petites cellules

FR  |  
EN
Auteur / Autrice : Nicolas Captier
Direction : Emmanuel BarillotIrène Buvat
Type : Thèse de doctorat
Discipline(s) : Génétique et génomique
Date : Soutenance le 31/05/2024
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Complexité du vivant (Paris ; 2009-....)
Partenaire(s) de recherche : Laboratoire : Cancer et Génome: Bioinformatique, Biostatistiques et Epidémiologie des systèmes complexes
établissement opérateur d'inscription : Institut Curie - PSL
Jury : Président / Présidente : Chloé-Agathe Azencott
Examinateurs / Examinatrices : Emmanuel Barillot, Irène Buvat, Lodewyk Wessels, John Prior, Fatima Al-Shahrour, Julia Schnabel
Rapporteurs / Rapporteuses : Lodewyk Wessels, John Prior

Résumé

FR  |  
EN

La survie globale des patients atteints de cancer du poumon non à petites cellules (CPNPC) métastatique a augmenté grâce à l’utilisation d’immunothérapies anti-PD1/PD-L1. Cependant, la durée de la réponse reste très variable d'un patient à l'autre, et seuls 20 à 30 % des patients sont encore en vie après deux ans. Par conséquent, de nouveaux biomarqueurs permettant de prédire la réponse au traitement et le pronostic des patients sont nécessaires pour guider la décision thérapeutique. Dans le cadre de mon doctorat, nous avons étudié des approches d'apprentissage automatique pour exploiter les données radiologiques, transcriptomiques et pathologiques, en les intégrant dans des modèles multimodaux susceptibles d'améliorer le pouvoir prédictif limité des données de routine clinique.Mon doctorat était au cœur d'un projet multidisciplinaire financé par la Fondation ARC, intitulé "SIGN'IT 2020-Signatures en Immunothérapie". Il réunissait plusieurs équipes de recherche de l'Institut Curie aux côtés d'une équipe de l'Institut du thorax, dirigée par le Professeur Nicolas Girard, en charge de la prise en charge des patients et de la collecte des données. Nous avons constitué une nouvelle cohorte multimodale de 317 patients atteints de CPNPC métastatique traités, en première ligne, par immunothérapie, seule ou associée à une chimiothérapie. Avant le début du traitement, nous avons recueilli des informations cliniques provenant des soins de routine, des examens TEP/TDM au 18F-FDG, des lames pathologiques numérisées provenant du diagnostic initial et des profils RNA-seq provenant de biopsies solides. Les résultats de l'immunothérapie ont été évalués en fonction de la survie globale (OS) et de la survie sans progression (PFS) de chaque patient.En collaboration avec Irène Buvat et Emmanuel Barillot, dont les équipes sont respectivement spécialisées dans l'analyse d'images médicales et de profils tumoraux RNA-seq, nous nous sommes d'abord concentrés sur la conception d'outils informatiques permettant d'extraire des informations pertinentes et interprétables à partir de ces deux modalités de données. Nous avons notamment développé un outil Python pour appliquer l'Analyse en Composantes Indépendantes (ICA) sur les données omiques et stabiliser les résultats à travers de multiples exécutions. Nous avons ensuite exploré le potentiel de l'ICA stabilisée pour extraire des caractéristiques transcriptomiques puissantes et biologiquement pertinentes pour la prédiction des résultats des patients. Pour les images médicales, et en particulier les examens TEP au 18F-FDG, nous avons étudié le potentiel des approches radiomiques pour caractériser la maladie métastatique au niveau du corps entier et concevoir de nouvelles caractéristiques prédictives. Nous avons conçu un outil d'explication Python, basé sur les valeurs de Shapley, pour mettre en évidence la contribution de chaque métastase individuelle à la prédiction des modèles radiomiques.Une part importante de mon doctorat a été consacrée à l'intégration des caractéristiques cliniques, radiomiques et transcriptomiques, ainsi que des caractéristiques pathomiques (avec l'aide de l'équipe de Thomas Walter). Nous avons procédé à une comparaison approfondie des capacités prédictives des différentes combinaisons multimodales en utilisant divers algorithmes d'apprentissage et méthodes d'intégration. Nous avons conçu des stratégies pour surmonter les nombreux défis associés à l'intégration multimodale, y compris la gestion des modalités manquantes pour de nombreux patients, la gestion d'une taille de cohorte modeste par rapport à la haute dimensionnalité des données, ou la garantie d'une comparaison équitable de toutes les combinaisons multimodales possibles. Nous nous sommes particulièrement attachés à mettre en évidence le potentiel des approches multimodales pour améliorer la stratification des risques des patients par rapport aux modèles utilisant uniquement des informations de routine clinique.