Thèse en cours

Apprentissage Statistique pour des données de cytométrie en flux pour la caractérisation précoce de la Leucémie Aiguë Myéloblastique

FR  |  
EN
Auteur / Autrice : Jonathan Legrand
Direction : Christèle EtchegarayBaudouin Denis de senneville
Type : Projet de thèse
Discipline(s) : Mathématiques appliquées et calcul scientifique
Date : Inscription en doctorat le 01/11/2024
Etablissement(s) : Bordeaux
Ecole(s) doctorale(s) : École doctorale de mathématiques et informatique
Partenaire(s) de recherche : Laboratoire : IMB - Institut de Mathématiques de Bordeaux
Equipe de recherche : Calcul Scientifique et Modélisation

Résumé

FR  |  
EN

La Leucémie Aigüe Myéloblastique (LAM) est une forme agressive de cancer de la moelle osseuse, caractérisée par la prolifération de cellules sanguines immatures. La LAM représente 1% des cancers, et son incidence augmente avec le vieillissement de la population. L'amélioration des traitements pour la LAM constitue donc un enjeu de santé majeur. Le diagnostic est établi à partir de l'analyse d'une ponction de moelle osseuse par myélogramme, puis par cytométrie en flux. Le traitement typique est la chimiothérapie intensive qui début dès que possible. Pour certains patients après 60 ans, ce traitement peut se révéler inefficace. Des traitements alternatifs et/ou l'inclusion dans un essai clinique pourraient être proposés si seulement ces patients étaient identifiés dès le diagnostic. Une étude récente a permis de construire un outil d'aide à la décision basé sur la cytogénétique et des biomarqueurs génétiques(anomalies chromosomiques et mutations). Cet outil est capable de classer les patients en trois groupes d'adéquation de la chimiothérapie intensive : 'go-go', 'no-go', 'slow-go' selon que ce choix est favorable, défavorable, ou intermédiaire. Malheureusement,ces biomarqueurs sont obtenus trop tard pour aider la décision thérapeutique initiale. Dans ce projet, nous allons développer des approches d'apprentissage statistique pour des données de cytométrie en flux obtenues au diagnostic, de façon à prédire les marqueurs cytogénétiques et moléculaires d'intérêt pour éclairer la décision thérapeutique. Les données de cytométrie en flux se présentent comme des tableaux où, pour chaque patient, des dizaines de milliers de cellules sont caractérisées individuellement par deux marqueurs de taille et de granularité, et par dix marqueurs d'expression en différentes protéines associées à des fonctions biologiques. Il s'agit donc de données complexes et de grande dimension, dont l'analyse requiert une méthodologie robuste et soigneusement développée. Dans un premier temps, nous développerons des modèles d'apprentissage afin de prédire la présence de mutations, qui sont déjà ellesmêmes des biomarqueurs du pronostic. Puis, nous combinerons ces modèles avec un modèle de prédiction du statut cytogénétique. Nous serons alors capables de prédire de manière personnalisée l'adéquation de la chimiothérapie intensive dès le diagnostic, ainsi que les profils cytogénétique et de mutation des patients. En particulier, les patients pour lesquels le traitement classique est incontestablement recommandé ou déconseillé seront mieux identifiés dès le départ, améliorant le choix thérapeutique et permettant l'inclusion dans des essais cliniques dès que possible.