Co-analyse de données radiomiques, pathologiques, et transcriptomiques pour la compréhension et la prédiction de la réponse à l’immunothérapie chez des patients atteints de cancer du poumon non à petites cellules
Auteur / Autrice : | Nicolas Captier |
Direction : | Emmanuel Barillot, Irène Buvat |
Type : | Thèse de doctorat |
Discipline(s) : | Génétique et génomique |
Date : | Soutenance le 31/05/2024 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Complexité du vivant (Paris ; 2009-....) |
Partenaire(s) de recherche : | Laboratoire : Cancer et Génome: Bioinformatique, Biostatistiques et Epidémiologie des systèmes complexes |
établissement opérateur d'inscription : Institut Curie - PSL | |
Jury : | Président / Présidente : Chloé-Agathe Azencott |
Examinateurs / Examinatrices : Emmanuel Barillot, Irène Buvat, Lodewyk Wessels, John Prior, Fatima Al-Shahrour, Julia Schnabel | |
Rapporteurs / Rapporteuses : Lodewyk Wessels, John Prior |
Mots clés
Résumé
La survie globale des patients atteints de cancer du poumon non à petites cellules (CPNPC) métastatique a augmenté grâce à l’utilisation d’immunothérapies anti-PD1/PD-L1. Cependant, la durée de la réponse reste très variable d'un patient à l'autre, et seuls 20 à 30 % des patients sont encore en vie après deux ans. Par conséquent, de nouveaux biomarqueurs permettant de prédire la réponse au traitement et le pronostic des patients sont nécessaires pour guider la décision thérapeutique. Dans le cadre de mon doctorat, nous avons étudié des approches d'apprentissage automatique pour exploiter les données radiologiques, transcriptomiques et pathologiques, en les intégrant dans des modèles multimodaux susceptibles d'améliorer le pouvoir prédictif limité des données de routine clinique.Mon doctorat était au cœur d'un projet multidisciplinaire financé par la Fondation ARC, intitulé "SIGN'IT 2020-Signatures en Immunothérapie". Il réunissait plusieurs équipes de recherche de l'Institut Curie aux côtés d'une équipe de l'Institut du thorax, dirigée par le Professeur Nicolas Girard, en charge de la prise en charge des patients et de la collecte des données. Nous avons constitué une nouvelle cohorte multimodale de 317 patients atteints de CPNPC métastatique traités, en première ligne, par immunothérapie, seule ou associée à une chimiothérapie. Avant le début du traitement, nous avons recueilli des informations cliniques provenant des soins de routine, des examens TEP/TDM au 18F-FDG, des lames pathologiques numérisées provenant du diagnostic initial et des profils RNA-seq provenant de biopsies solides. Les résultats de l'immunothérapie ont été évalués en fonction de la survie globale (OS) et de la survie sans progression (PFS) de chaque patient.En collaboration avec Irène Buvat et Emmanuel Barillot, dont les équipes sont respectivement spécialisées dans l'analyse d'images médicales et de profils tumoraux RNA-seq, nous nous sommes d'abord concentrés sur la conception d'outils informatiques permettant d'extraire des informations pertinentes et interprétables à partir de ces deux modalités de données. Nous avons notamment développé un outil Python pour appliquer l'Analyse en Composantes Indépendantes (ICA) sur les données omiques et stabiliser les résultats à travers de multiples exécutions. Nous avons ensuite exploré le potentiel de l'ICA stabilisée pour extraire des caractéristiques transcriptomiques puissantes et biologiquement pertinentes pour la prédiction des résultats des patients. Pour les images médicales, et en particulier les examens TEP au 18F-FDG, nous avons étudié le potentiel des approches radiomiques pour caractériser la maladie métastatique au niveau du corps entier et concevoir de nouvelles caractéristiques prédictives. Nous avons conçu un outil d'explication Python, basé sur les valeurs de Shapley, pour mettre en évidence la contribution de chaque métastase individuelle à la prédiction des modèles radiomiques.Une part importante de mon doctorat a été consacrée à l'intégration des caractéristiques cliniques, radiomiques et transcriptomiques, ainsi que des caractéristiques pathomiques (avec l'aide de l'équipe de Thomas Walter). Nous avons procédé à une comparaison approfondie des capacités prédictives des différentes combinaisons multimodales en utilisant divers algorithmes d'apprentissage et méthodes d'intégration. Nous avons conçu des stratégies pour surmonter les nombreux défis associés à l'intégration multimodale, y compris la gestion des modalités manquantes pour de nombreux patients, la gestion d'une taille de cohorte modeste par rapport à la haute dimensionnalité des données, ou la garantie d'une comparaison équitable de toutes les combinaisons multimodales possibles. Nous nous sommes particulièrement attachés à mettre en évidence le potentiel des approches multimodales pour améliorer la stratification des risques des patients par rapport aux modèles utilisant uniquement des informations de routine clinique.