Thèse en cours

Apprentissage supervisé interprétable multi-classe et non commensurable -applications dans le cadre du microbiote intestinal

FR  |  
EN
Auteur / Autrice : Fabien Kambu mbuangi
Direction : Edi PriftiIdy Diop
Type : Projet de thèse
Discipline(s) : Sciences et technologies de l'information et de la communication
Date : Inscription en doctorat le 01/03/2022
Etablissement(s) : Sorbonne université en cotutelle avec Université Cheikh Anta Diop de Dakar
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : Unité de Modélisation Mathématique et Informatique des Systèmes Complexes

Résumé

FR  |  
EN

Apprentissage supervisé interprétable multi-classe et non-commensurable -applications dans le cadre du microbiote intestinal. La découverte de biomarqueurs du microbiome pour le diagnostic, le pronostic et l'évaluation des risques des patients suscite un large intérêt. Des variables sélectionnées des caractéristiques microbiennes des échantillons des patients fournissent des signatures qui caractérisent les états pathologiques de l'hôte tels que le cancer ou les maladies cardio-métaboliques. Cependant, les modèles prédictifs actuels issus de l'apprentissage supervisé sont souvent opaques et peu interprétables par les médecins et les biologistes, ce qui les rend difficiles à adopter dans le processus de prise de décision médecin-patient. De nouvelles méthodes offrant plus d'interprétabilité et un aperçu biologique sont apparues tels que « predomics ». Cette approche originale d'apprentissage automatique inspirée des interactions microbiennes au sein de l'écosystème est particulièrement adaptée aux données commensurables du microbiome. Cependant cette approche ne permet pas d'intégrer dans ces modèles d'autres types données non-commensurables telles que les caractéristiques des patients, ou bien de faire de la classification multi-classe. Dans le cadre de cette thèse nous chercherons à proposer de nouvelles approches méthodologiques permettant d'étendre le champ d'application de l'approche « predomics » au-delà des données commensurables. Nous validerons la méthode dans un contexte de données simulées ainsi que des données réelles provenant du projet MetaCardis, caractérisant plus de 2000 patients du spectre cardio-métabolique.