Thèse soutenue

Modélisation et prédiction dynamique individuelle d'événements de santé à partir de données longitudinales multivariées

FR  |  
EN
Auteur / Autrice : Anthony Devaux
Direction : Cecile Proust-LimaRobin Genuer
Type : Thèse de doctorat
Discipline(s) : Santé publique Option Biostatistiques
Date : Soutenance le 29/11/2022
Etablissement(s) : Bordeaux
Ecole(s) doctorale(s) : École doctorale Sociétés, politique, santé publique (Talence, Gironde ; 2011-....)
Partenaire(s) de recherche : Laboratoire : Bordeaux population Health
Jury : Président / Présidente : Virginie Rondeau
Examinateurs / Examinatrices : Philippe Saint Pierre
Rapporteurs / Rapporteuses : Agathe Guilloux, Yohann Foucher

Résumé

FR  |  
EN

En santé publique, la prédiction d’un évènement de santé est un enjeu crucial pour le devenir du patient. A partir de méthodes statistiques, cette prédiction peut être estimée de manière individuelle en utilisant les données propres à chaque patient. Cependant, la plupart des modèles actuels ne permettent pas de prendre en compte un grand nombre d’informations répétées. L’objectif de ce travail de thèse est de développer de nouvelles méthodes statistiques pouvant intégrer un ensemble de prédicteurs collectés au cours du temps pour prédire au mieux un évènement de santé. Dans la première partie, nous proposons une approche landmark où des résumés de données longitudinales, calculés au temps landmark, sont utilisés pour estimer le risque de survenue de l’évènement à travers plusieurs méthodes adaptées à la grande dimension. Cette méthode a également été étendue dans le cadre de risques compétitifs pour prédire la survenue de la démence pour les individus de la cohorte des trois-cités. Dans la deuxième partie, nous proposons d’intégrer les données répétées de variables dans les forêts aléatoires en survie pour prendre en compte la possible sortie d’étude informative des patients. Cette nouvelle méthodologie a été développée dans un package R DynForest disponible pour les utilisateurs. Elle a été appliquée pour (i) prédire la probabilité de survenue de démence à partir des trajectoires de multiples variables mesurant notamment la dépendance fonctionnelle, la cognition, l’atrophie cérébrale et les lésions vasculaires cérébrales (ii) prédire la survenue du vasospasme cérébral chez les patients ayant subi une hémorragie sous-arachnoïdienne. Par ces travaux, nous ouvrons la voie à l’intégration d’un grand nombre de données longitudinales pour prédire le risque de survenue d’évènements.