Thèse soutenue

Modélisation prédictive des parcours de soins à l'aide de techniques de process mining et de deep learning

FR  |  
EN
Auteur / Autrice : Hugo De oliveira
Direction : Vincent AugustoXiaolan Xie
Type : Thèse de doctorat
Discipline(s) : Génie Industriel
Date : Soutenance le 26/11/2020
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : Ed Sis 488
Partenaire(s) de recherche : établissement opérateur d'inscription : École nationale supérieure des mines (Saint-Etienne ; 1816-....)
Laboratoire : Centre Ingénierie et Santé / CIS-ENSMSE
Jury : Président / Présidente : Emmanuel Bacry
Examinateurs / Examinatrices : Emmanuel Bacry, Clarisse Dhaenens, Frédérique Laforest, Laurence Watier, Ludovic Lamarsalle, Martin Prodel
Rapporteurs / Rapporteuses : Clarisse Dhaenens, Frédérique Laforest

Résumé

FR  |  
EN

Les bases de données médico-administratives sont des bases de données de santé particulièrement exhaustives. L’objectif de ce travail réside dans le développement d’algorithmes prédictifs à partir des données de parcours patients, considérant la complexité des données médico-administratives et produisant des résultats explicables. De nouveaux modèles de processus et un algorithme de process mining adapté sont présentés, modélisant les transitions et leurs temporalités. Une solution de prétraitement des journaux d’événements est également proposée, permettant une représentation des évènements complexes caractérisés par de multiples codes appartenant à différents systèmes de codage, organisés en structures hiérarchiques. Cette méthode de clustering par auto-encodage permet de regrouper dans l’espace latent les événements similaires et produit automatiquement des labels pertinents pour le process mining, explicables médicalement. Un premier algorithme de prédiction adapté aux parcours est alors proposé, produisant via une procédure d’optimisation un modèle de processus utilisé pour classifier les parcours directement à partir des données de journaux d’événements. Ce modèle de processus sert également de support pour expliquer les patterns de parcours distinctifs entre deux populations. Une seconde méthode de prédiction est présentée, avec un focus particulier sur les événements médicaux récurrents. En utilisant des images pour modéliser les parcours, et une architecture d’auto-encodage variationnel modifiée pour l’apprentissage prédictif, cette méthode permet de classifier tout en expliquant de manière globale, en visualisant une image des facteurs prédictifs identifiés.