Modélisation et prédiction dynamique individuelle d'événements de santé à partir de données longitudinales multivariées
Auteur / Autrice : | Anthony Devaux |
Direction : | Cecile Proust-Lima, Robin Genuer |
Type : | Thèse de doctorat |
Discipline(s) : | Santé publique Option Biostatistiques |
Date : | Soutenance le 29/11/2022 |
Etablissement(s) : | Bordeaux |
Ecole(s) doctorale(s) : | École doctorale Sociétés, politique, santé publique (Talence, Gironde ; 2011-....) |
Partenaire(s) de recherche : | Laboratoire : Bordeaux population Health |
Jury : | Président / Présidente : Virginie Rondeau |
Examinateurs / Examinatrices : Philippe Saint Pierre | |
Rapporteurs / Rapporteuses : Agathe Guilloux, Yohann Foucher |
Mots clés
Résumé
En santé publique, la prédiction d’un évènement de santé est un enjeu crucial pour le devenir du patient. A partir de méthodes statistiques, cette prédiction peut être estimée de manière individuelle en utilisant les données propres à chaque patient. Cependant, la plupart des modèles actuels ne permettent pas de prendre en compte un grand nombre d’informations répétées. L’objectif de ce travail de thèse est de développer de nouvelles méthodes statistiques pouvant intégrer un ensemble de prédicteurs collectés au cours du temps pour prédire au mieux un évènement de santé. Dans la première partie, nous proposons une approche landmark où des résumés de données longitudinales, calculés au temps landmark, sont utilisés pour estimer le risque de survenue de l’évènement à travers plusieurs méthodes adaptées à la grande dimension. Cette méthode a également été étendue dans le cadre de risques compétitifs pour prédire la survenue de la démence pour les individus de la cohorte des trois-cités. Dans la deuxième partie, nous proposons d’intégrer les données répétées de variables dans les forêts aléatoires en survie pour prendre en compte la possible sortie d’étude informative des patients. Cette nouvelle méthodologie a été développée dans un package R DynForest disponible pour les utilisateurs. Elle a été appliquée pour (i) prédire la probabilité de survenue de démence à partir des trajectoires de multiples variables mesurant notamment la dépendance fonctionnelle, la cognition, l’atrophie cérébrale et les lésions vasculaires cérébrales (ii) prédire la survenue du vasospasme cérébral chez les patients ayant subi une hémorragie sous-arachnoïdienne. Par ces travaux, nous ouvrons la voie à l’intégration d’un grand nombre de données longitudinales pour prédire le risque de survenue d’évènements.