Thèse soutenue

Modélisation de la stéatose hépatique (NAFLD) et de ses facteurs de risque par apprentissage sur des données de santé

FR  |  
EN
Auteur / Autrice : Pierre Bauvin
Direction : Philippe MathurinSylvie Deuffic-Burban
Type : Thèse de doctorat
Discipline(s) : Santé publique, environnement et société
Date : Soutenance le 10/12/2020
Etablissement(s) : Université de Lille (2018-2021)
Ecole(s) doctorale(s) : École doctorale Biologie-Santé (Lille ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Institute for Translational Research in Inflammation - U 1286 / INFINITE (Ex-Liric)
Jury : Examinateurs / Examinatrices : Sylvie Deuffic-Burban

Résumé

FR  |  
EN

La stéatose hépatique non-alcoolique (NAFLD) est une maladie chronique du foie regroupant la stéatose simple à évolution lente, et la stéatohépatite non-alcoolique (NASH), forme inflammatoire accélérant son évolution. On estime qu’une personne sur quatre dans le monde est atteinte de NAFLD, et cette prévalence augmente rapidement, en parallèle avec celle de ses principaux facteurs de risque : le surpoids, l’obésité et le diabète. Cette pathologie est asymptomatique jusqu’aux complications, la cirrhose et le cancer du foie (carcinome hépatocellulaire, CHC), ce qui induit un diagnostic tardif et un impact négatif sur la morbidité et mortalité associées. De plus, le diagnostic de référence nécessite une biopsie hépatique, un examen invasif qui ne peut être réalisé en routine. En conséquence, la progression de la maladie est mal connue et son estimation peut souffrir d’un biais de sélection, vers les patients présentant des facteurs de risques importants, qui nécessitaient une biopsie en premier lieu. Mieux l’appréhender permettrait de mettre en place des stratégies diminuant son fardeau.L’approche par modélisation est appropriée pour prendre en compte l’ensemble des patients susceptibles, sans avoir à réaliser d’étude de suivi à large échelle par biopsie hépatique chez des patients en majorité asymptomatiques. Les objectifs de cette thèse sont de décrire et quantifier la progression de la NAFLD, de prédire la morbidité et mortalité associées, ainsi que d’identifier la population à risque, par modèles de Markov. Pour cela, il est nécessaire de renseigner une partie des paramètres de progression via une revue de la littérature, de caractériser les états initiaux (population susceptible de développer la NAFLD) et les états finaux (mortalité due à la NAFLD), pour en déduire les paramètres de progression manquants entre l’entrée dans la maladie et la mortalité, par rétro-calcul.Pour caractériser la mortalité due à la NAFLD de manière exhaustive, nous avons identifié tous les patients avec une cirrhose ou un CHC à partir des bases de données nationales des hôpitaux, soit plus de 380 000 patients. Nous avons ensuite élaboré un algorithme d’identification pour déterminer l’étiologie sous-jacente à la complication hépatique, à partir de l’ensemble des séjours des patients identifiés. Cet algorithme nécessite d’identifier les patients avec cirrhose ou CHC d’origine alcoolique ou virale, pour obtenir par élimination uniquement les patients NAFLD.Une fois les données de mortalité spécifiques obtenues, nous avons estimé la population susceptible de développer la NAFLD, définie comme l’ensemble des individus avec un surpoids ou un diabète de type 2, en excluant la population de buveurs excessifs. Nous avons estimé la prévalence et l’incidence de cette population, et modélisé son évolution avec l’âge et les années, à partir de données individuelles d’enquêtes représentatives de la population française.Enfin, nous avons quantifié la progression de la NAFLD, et l’impact des facteurs de risque, via deux approches : à partir de la littérature, et à partir de données de biopsies de plus de 1 800 patients obèses candidats à la chirurgie bariatrique, aboutissant à un outil de prédiction de la progression de la NAFLD dans cette population. Nous avons choisi de rétro-calculer les paramètres de progression correspondant aux états asymptomatiques, les plus susceptibles au biais de sélection.Nous avons obtenu un modèle de l’évolution de la NAFLD, prenant en compte la distribution dynamique de la population parmi les classes de poids et le statut de diabète, et aboutissant aux statistiques observées de décès dus à la NAFLD. Le modèle prend en compte le sexe, l’âge, l’année, la classe d’IMC, le statut de diabète et la présence d’un polymorphisme génétique (PNPLA3 rs738409, C→G) comme covariables de progression. Il constitue un outil permettant d’évaluer l’impact d’un éventuel traitement ou d’une politique de santé publique sur la morbi-mortalité.