Apprentissage à partir de données multimodales pour prédire le pronostic du cancer du sein
| Auteur / Autrice : | Ndèye Maguette Mbaye |
| Direction : | Chloé-Agathe Azencott |
| Type : | Thèse de doctorat |
| Discipline(s) : | Bio-informatique |
| Date : | Soutenance le 05/09/2024 |
| Etablissement(s) : | Université Paris sciences et lettres |
| Ecole(s) doctorale(s) : | Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique (Paris) |
| Partenaire(s) de recherche : | Laboratoire : Centre de bio-informatique (Paris, Ile-De-France) |
| établissement de préparation de la thèse : École nationale supérieure des mines (Paris ; 1783-....) | |
| Jury : | Président / Présidente : Marc Lelarge |
| Examinateurs / Examinatrices : Chloé-Agathe Azencott, Alice Ahlem Othmani, Martin Bøgsted, Michal Rosen-Zvi, Antoine Recanati | |
| Rapporteurs / Rapporteuses : Alice Ahlem Othmani, Martin Bøgsted |
Résumé
Le cancer du sein est l’un des cancers les plus fréquents dans le monde, représentant 12,5 % des nouveaux cas annuels. En 2022, environ 2,3 millions de femmes ont été diagnostiquées, avec plus de 666 000 décès. Bien que les dossiers médicaux électroniques (DME) aient révolutionné la recherche clinique en fournissant des données précieuses, les études sur le cancer du sein exploitent rarement les rapports médicaux en texte libre, qui contiennent pourtant des informations cruciales. Cette thèse propose de développer des modèles d’apprentissage automatique et profond pour prédire les statuts de survie du cancer du sein en utilisant des données multimodales (rapports textuels en français, résultats de laboratoire et descripteurs cliniques) d’une vaste cohorte de l’Institut Curie. Des modèles ont été construits pour analyser séparément puis conjointement ces modalités. Les résultats montrent que l’intégration des données textuelles et structurées améliore la prédiction des statuts de survie des patientes. De plus, l'analyse des facteurs prédictifs des statuts de survie des patients ouvre de nouvelles perspectives pour une meilleure compréhension des mécanismes du cancer du sein et par conséquent, l’amélioration des soins.