Analyse de données en grande dimension avec modèles de survie en présence de risques concurrents.
Auteur / Autrice : | Hugo Cannafarina |
Direction : | Cristian Preda, Guillemette Marot |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques et leurs interactions |
Date : | Inscription en doctorat le 01/11/2024 |
Etablissement(s) : | Université de Lille (2022-....) |
Ecole(s) doctorale(s) : | MADIS Mathématiques, sciences du numérique et de leurs interactions |
Partenaire(s) de recherche : | Laboratoire : INRIA - Institut national de recherche en informatique et en automatique Lille Nord Europe |
Equipe de recherche : INRIA-PAINLEVE |
Mots clés
Résumé
Le but de la thèse est de développer une nouvelle méthode statistique de sélection de variables dans un contexte d'analyse de survie, avec risques concurrents, où les mesures sont répétées dans le temps sur des milliers de variables simultanément. Il s'agira par exemple de pouvoir identifier de nouveaux marqueurs omiques (transcriptomiques, métabolomiques, protéomiques) dans un but prédictif pour pouvoir adapter le traitement de patients (médecine de précision). L'originalité de l'approche statistique consiste à traiter simultanément trois verrous scientifiques : i) l'analyse en grande dimension (plus de variables que d'individus), ii) l'analyse de risques concurrents dans le cadre de modèles de survie et iii) l'analyse de données longitudinales (mesures répétées sur les mêmes individus). Des résultats sont attendus à la fois sur le plan méthodologique en biostatistique et sur le plan logiciel pour fournir un outil d'aide à la décision clinique.