Thèse soutenue

Définition et validation d’algorithmes d’identification des cas de diabète dans les bases de données médico-administratives à partir de la cohorte Constances et application à l’étude de l’évolution de la prévalence et de l’incidence du diabète dans le SNDS

FR  |  
EN
Auteur / Autrice : Sonsoles Fuentes gutierrez
Direction : Emmanuel Cosson
Type : Thèse de doctorat
Discipline(s) : Santé publique - épidémiologie
Date : Soutenance le 17/09/2020
Etablissement(s) : Paris Est
Ecole(s) doctorale(s) : École doctorale Santé Publique
Partenaire(s) de recherche : Laboratoire : Santé publique France - Santé publique France
établissement opérateur d'inscription : Université Paris-Est Créteil Val de Marne. Faculté de santé
Jury : Président / Présidente : Pierre Fontaine
Examinateurs / Examinatrices : Emmanuel Cosson, Alfred Penfornis, Annick Fontbonne, Fabrice Bonnet, Guy Fagherazzi, Bruno Detournay, Sébastien Czernichow
Rapporteurs / Rapporteuses : Alfred Penfornis, Annick Fontbonne

Résumé

FR  |  
EN

Contexte: Le Système National de Données Santé (SNDS) est une base de données médico-administratives (BDMA) comprenant des informations sur les remboursements de soins en ville, sur les hospitalisations en secteur public et privé et sur les décès de l’ensemble de la population résidant en France. Il s’agit d’une des sources de données majeures du dispositif de surveillance épidémiologique du diabète en France. Cette source d’informations de type Big data offre un vaste potentiel en termes de surveillance épidémiologique qui ne peut être développé qu’après avoir levé les défis méthodologiques associés au recours à ces outils.Objectifs: Les objectifs de cette thèse sont d’utiliser les données de la cohorte Constances pour améliorer le système de surveillance du diabète basé sur le SNDS et développer de nouveaux outils en appliquant la méthodologie Machine Learning.Résultats: Dans un premier temps, l’étude de validation des algorithmes d’identification des cas de diabète, à partir de la cohorte Constances, a montré qu’ils avaient d’excellentes performances que ce soit pour le diabète connu ou traité pharmacologiquement. L’algorithme basé sur les remboursements de traitements antidiabétiques a été retenu pour l’étude de l’évolution de l’épidémie du diabète en France dans le SNDS. Entre 2010 et 2017, une légère augmentation de la prévalence et une diminution de l’incidence sur la période 2012-2017, ont été observées chez les adultes âgées 45 ans ou plus. Ensuite, une méthodologie de type Machine Learning a été appliquée aux données de la cohorte Constances afin de développer un algorithme de typage du diabète. Un modèle d’analyse discriminante linéaire a été retenu, basé sur le nombre de remboursements d’insuline à action rapide, d’insuline de longue durée et de biguanides au cours des 12 mois. En utilisant la même méthodologie, deux autres algorithmes ont été développés pour identifier les cas de diabète non diagnostiqué et les cas du prédiabète. Ces deux algorithmes étaient basé sur des modèles de régression logistique. Le premier algorithme retenait 5 variables (âge, sexe et nombre de remboursements sur 12 mois de bilans lipidiques, de dosages de glycémie et de consultations d’un médecin généraliste) et le deuxième retenait 6 variables (âge, sexe et nombre de remboursements de dosages d’antigène prostatique spécifique, de glycémie et d’HbA1C et de bilans lipidiques).Conclusion: Les BDMAs, telles que le SNDS, représentent une opportunité pour la surveillance épidémiologique du diabète, élément central pour le déploiement des programmes de prévention et des politiques de santé publique.