Modélisation prédictive des parcours de soins à l'aide de techniques de process mining et de deep learning
Auteur / Autrice : | Hugo De oliveira |
Direction : | Vincent Augusto, Xiaolan Xie |
Type : | Thèse de doctorat |
Discipline(s) : | Génie Industriel |
Date : | Soutenance le 26/11/2020 |
Etablissement(s) : | Lyon |
Ecole(s) doctorale(s) : | Ed Sis 488 |
Partenaire(s) de recherche : | établissement opérateur d'inscription : École nationale supérieure des mines (Saint-Etienne ; 1816-....) |
Laboratoire : Centre Ingénierie et Santé / CIS-ENSMSE | |
Jury : | Président / Présidente : Emmanuel Bacry |
Examinateurs / Examinatrices : Emmanuel Bacry, Clarisse Dhaenens, Frédérique Laforest, Laurence Watier, Ludovic Lamarsalle, Martin Prodel | |
Rapporteurs / Rapporteuses : Clarisse Dhaenens, Frédérique Laforest |
Mots clés
Résumé
Les bases de données médico-administratives sont des bases de données de santé particulièrement exhaustives. L’objectif de ce travail réside dans le développement d’algorithmes prédictifs à partir des données de parcours patients, considérant la complexité des données médico-administratives et produisant des résultats explicables. De nouveaux modèles de processus et un algorithme de process mining adapté sont présentés, modélisant les transitions et leurs temporalités. Une solution de prétraitement des journaux d’événements est également proposée, permettant une représentation des évènements complexes caractérisés par de multiples codes appartenant à différents systèmes de codage, organisés en structures hiérarchiques. Cette méthode de clustering par auto-encodage permet de regrouper dans l’espace latent les événements similaires et produit automatiquement des labels pertinents pour le process mining, explicables médicalement. Un premier algorithme de prédiction adapté aux parcours est alors proposé, produisant via une procédure d’optimisation un modèle de processus utilisé pour classifier les parcours directement à partir des données de journaux d’événements. Ce modèle de processus sert également de support pour expliquer les patterns de parcours distinctifs entre deux populations. Une seconde méthode de prédiction est présentée, avec un focus particulier sur les événements médicaux récurrents. En utilisant des images pour modéliser les parcours, et une architecture d’auto-encodage variationnel modifiée pour l’apprentissage prédictif, cette méthode permet de classifier tout en expliquant de manière globale, en visualisant une image des facteurs prédictifs identifiés.