Thèse soutenue

Apprentissage par renforcement et outcome-weighted learning bayésien pour la médecine de précision : Intégration de connaissances médicales dans les algorithmes de décision

FR  |  
EN
Auteur / Autrice : Sophia Yazzourh
Direction : Nicolas SavyPhilippe Saint Pierre
Type : Thèse de doctorat
Discipline(s) : Mathématiques et Applications
Date : Soutenance le 22/10/2024
Etablissement(s) : Université de Toulouse (2023-....)
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de mathématiques de Toulouse (2007-....)
Jury : Président / Présidente : Raphaël Porcher
Examinateurs / Examinatrices : Emmanuelle Claeys
Rapporteur / Rapporteuse : Rodolphe Thiébaut, Julie Josse

Résumé

FR  |  
EN

La médecine de précision vise à adapter les traitements aux caractéristiques de chaque patient en s'appuyant sur les formalismes des ''Individualized Treatment Regimes'' (ITR) et des ''Dynamic Treatment Regimes'' (DTR). Les ITR concernent une seule décision thérapeutique, tandis que les DTR permettent l'adaptation des traitements au fil du temps via une séquence de décisions. Pour être pertinentes, ces approches doivent être en mesure de traiter des données complexes et d'intégrer les connaissances médicales, essentielles pour permettre une utilisation clinique réaliste et sans risques. Cette thèse présente trois projets de recherche. Premièrement, un état de l'art des méthodes d'intégration des connaissances médicales dans les modèles de ''Reinforcement Learning'' (RL) a été réalisé, en tenant compte du contexte des DTR et de leurs contraintes spécifiques pour une application sur des données observationnelles. Deuxièmement, une méthode probabiliste de construction des récompenses a été développée pour les modèles de RL, s'appuyant sur les préférences des experts médicaux. Illustrée par des études de cas sur le diabète et le cancer, cette méthode génère des récompenses de manière à exploiter les données, le savoir de l'expert médical et les relations entre les patients, évitant les biais de construction ''à la main'' et garantissant une cohérence avec les objectifs médicaux. Troisièmement, un cadre bayésien pour la méthode ''Outcome-Weighted Learning'' (OWL) a été proposé afin de quantifier l'incertitude dans les recommandations de traitement, renforçant ainsi la robustesse des décisions thérapeutiques, et a été illustré à travers de simulations de données. Les contributions de cette thèse visent à améliorer la fiabilité des outils de prise de décision en médecine de précision, d'une part en intégrant les connaissances médicales dans les modèles de RL, et d'autre part en proposant un cadre bayésien pour quantifier l'incertitude dans le modèle OWL. Ces travaux s'inscrivent dans une perspective globale de collaboration interdisciplinaire en particulier entre les domaines de l'apprentissage automatique, des sciences médicales et des statistiques.