Surveillance épidémiologique des Traumatismes crâniens légers (TCL) pris en charge aux urgences : développement d'algorithmes de repérage des passages aux urgences pour TCL dans la base de données OSCOUR®
Auteur / Autrice : | Louis-Marie Paget |
Direction : | Anne Gallay |
Type : | Projet de thèse |
Discipline(s) : | Epidémiologie |
Date : | Inscription en doctorat le 16/11/2020 |
Etablissement(s) : | Paris 12 |
Ecole(s) doctorale(s) : | École doctorale Santé Publique |
Partenaire(s) de recherche : | Laboratoire : Santé Publique France |
Equipe de recherche : Direction des maladies non transmissibles et des traumatismes |
Mots clés
Résumé
Les travaux s'articuleront autour de trois axes qui sont présentés de façon détaillée ci-dessous. Axe 1 : Détermination de l'algorithme de sélection des cas de TCL L'objectif du premier axe de la thèse sera de déterminer un algorithme de sélection des cas de TCL à partir des données d'OSCOUR®. Une première étape consistera à réaliser une revue bibliographique des algorithmes utilisés pour sélectionner les cas de TCL à partir des bases de données médico-administratives comparables à OSCOUR®. Cette synthèse de la littérature sera réalisée en utilisant différentes bases de données documentaires : dont Medline, et Embase. Les documents seront recherchés également dans la littérature grise. Cela permettra, en particulier, de repérer les rapports produits par les organismes de santé publique reconnus (Organisation mondiale de la santé, National institute for health and care excellence, Centers for disease control and prevention, ). Nous limiterons nos recherches aux études publiées en anglais et en Français, qui portent sur les humains, qui ont cherché à identifier les cas de TCL à partir de bases médico-administratives comparables à OSCOUR®, sur une période récente 2009-2019. Les articles majeurs hors périodes, cités très fréquemment dans les articles sélectionnés, seront également inclus. Pour identifier les études sur les TCL, différents termes pourront être utilisés dans les équations de recherche pour identifier les TCL par exemple : « concussion », « mild TBI », « minor head injury » et pour identifier les études basés sur des données médico-administrative: « emergency », « hospitalization » par exemple. Les termes MESH et EMTREE appropriés seront également utilisés pour sélectionner les publications. La sélection des articles sera réalisée à partir du contenu des résumés. Les articles sélectionnés seront analysés en utilisant une grille de lecture. Différentes informations seront extraites (liste non exhaustive): - Pays - Année d'étude - Taille de l'échantillon - Population d'étude - Objectif de l'étude - Type de données (urgences ou hospitalisation) - Définition clinique du TCL proposée - Liste des codes CIM-10 proposée - Validation de l'algorithme de sélection - Difficultés rencontrées pour identifier les cas de TCL - Biais pour l'identification des cas L'objectif à la fin de cette étude de la littérature sera de déterminer une ou plusieurs listes de codes CIM-10 pertinentes pour sélectionner les cas de TCL. Ces différents algorithmes seront ensuite utilisés sur les données OSCOUR® afin de vérifier, d'abord qu'ils sont applicables -il est possible que certains codes CIM-10 ne soient jamais ou rarement codés dans OSCOUR®- et ensuite de comparer les résultats (nombre de cas sélectionnés, caractéristiques des patients) à partir des différents algorithmes identifiés et applicables sur les données d'OSCOUR®. Cette analyse exploratoire fera l'objet du premier article de cette thèse. Les enseignements de la revue de la littérature, de l'analyse exploratoire des données d'OSCOUR® et les échanges avec le comité d'expert nous permettront de déterminer une ou plusieurs listes de codes CIM-10 pertinentes pour sélectionner les cas de TCL dans OSCOUR®. Axe 2 : Etude des qualités métrologiques du ou des algorithme(s) de sélection des TCL L'objectif du second axe de cette thèse sera d'étudier les qualités métrologiques du ou des algorithme(s) mis au point préalablement pour sélectionner les cas de TCL dans OSCOUR®. Principe générale de l'étude : Pour ce faire, en nous conformant aux règles de bonnes pratiques pour la conduite d'étude de validation d'algorithmes dans les bases de données médico-administratives proposées récemment [12, 13] nous commencerons par sélectionner dans différents services d'urgence, un échantillon aléatoire de dossiers de passages aux urgences. Ces dossiers seront ensuite classés en cas et non-cas de TCL au regard de critères précisément déterminés en amont. Ces dossiers de passages aux urgences seront ensuite chainés aux données d'OSCOUR® (à partir de l'identifiant du RPU) afin de vérifier si le ou les algorithmes « OSCOUR » classent correctement les cas et les non-cas de TCL. Les différents indicateurs classiquement utilisés dans les études de validation pourront ensuite être déterminés : Sensibilité, Spécificité, Valeur prédictive positive (VPP), Valeur prédictive négative (VPN). Sur le plan réglementaire, il sera nécessaire d'obtenir un accord la CNIL afin de pouvoir réaliser le chainage des données OSCOUR et des dossiers patients. Une demande d'autorisation sera donc rédigée et adressée à la CNIL en amont de cette étude. Sélection et classement des cas : Nous avons estimé que nous aurions besoin, au minimum, de 100 cas avec un diagnostic de TCL afin d'avoir des estimations de sensibilité et de spécificité de l'ordre de 50 % (scénario le plus défavorable sachant qu'on ne connait pas, a priori, la sensibilité et la spécificité de nos algorithmes dans OSCOUR) avec une précision de +/- 10 % et un risque α de 5 %. Ainsi, en supposant que les cas de TCL représentent 1 % des passages aux urgences (chiffre obtenu en supposant un taux d'incidence annuel de cas de TCL pris en charge aux urgences en France de 300 pour 100 000 personnes) nous aurions besoin d'un échantillon d'au moins 10 000 patients pour notre étude. Ainsi, 10 000 dossiers de passages aux urgences de patients pris en charge entre le 01/01/2019 et le 31/12/2019 (période la plus récente en amont de l'épidémie de COVID-19 qui a pu impacter le fonctionnement des services d'urgence et potentiellement le codage dans OSCOUR, pour laquelle nous aurons des données d'OSCOUR consolidées disponibles) seront sélectionnés aléatoirement dans 4 services d'urgences, afin de prendre en compte une éventuelle hétérogénéité inter-établissement dans le codage. Pour une question de faisabilité, tous les dossiers ne pourront pas être analysés manuellement. Nous commencerons par sélectionner, grâce à une recherche automatique de mots clés, l'ensemble des dossiers dans lesquels des termes décrivant possiblement des TCL seront retrouvés, par exemple : «Traumatisme crânien », « TC sans PC », « TC avec PC », « Glasgow 15 », « Fracture du crâne ». Ces dossiers sélectionnés à partir de la liste de mots clés seront considérés comme étant des dossiers de « cas potentiels » et les dossiers dans lesquels aucun mot clé de TCL n'aura été retrouvé seront considérés comme étant des dossiers de non-cas. Parmi les dossiers de non cas de TCL, 200 dossiers seront analysés par 4 investigateurs (personnels des départements d'information médicale (DIM) des hôpitaux participant à l'étude et personnels de Santé publique France) idéalement dans chacun des quatre centres participant à l'étude, afin de s'assurer que ces dossiers correspondent bien à des dossiers de non-cas. Dans l'éventualité où certains dossiers classés comme étant des non-cas s'avéraient être des TCL, la liste des mots clés serait réajustée. Le classement des dossiers en cas potentiels et non-cas, à partir des mots clés, serait alors réalisé de nouveau en utilisant la nouvelle liste de mots clés. L'échantillon de dossiers de cas potentiels sélectionnés grâce à la recherche automatique de mots clés dans les dossiers sera passé en revue également par les 4 investigateurs. Si le nombre précis de dossiers de cas potentiels sélectionnés avec les mots clés est difficilement prévisible, on peut raisonnablement penser que plus de 100 dossiers de cas potentiels seront sélectionnés. En termes de faisabilité, il semble que la limite à ne pas dépasser devra être de 1 000 dossiers de cas potentiels de TCL. Selon ce scénario, chaque investigateur aurait 250 dossiers à examiner. Les investigateurs auront pour missions de classer ces dossiers en « cas certains », «cas-possibles » et « non-cas » de TCL. Afin de s'assurer de la fiabilité intra et inter-investigateurs, 10 % des dossiers initiaux, (soit 25 dossiers) seront réexaminés : une fois par le même investigateur, pour évaluer la fiabilité intra-investigateur et une fois par un autre investigateur pour mesurer la fiabilité inter-investigateurs. Un score de Kappa sera ensuite calculé pour mesurer le degré de concordance entre les différents investigateurs. Par la suite, tous les dossiers de patients classés en «cas certains » ou «cas possibles », (environ 100 dossiers a priori) seront passés en revue par un médecin spécialiste du TCL et reclassés le cas échéant. Critères pour de classement des cas Différents niveaux de certitude pour les cas seront définis en fonction des éléments retrouvés dans les dossiers. La détermination précise de critères pour définir les cas devra être déterminée avec les experts cliniciens/urgentistes qui participeront à ce projet. Une option pourrait être de considérer que les dossiers dans lesquels les critères établis par l'OMS [3] pour diagnostiquer un TCL seront décrits, seront considérés comme des dossiers de cas certains : (1) Une mention explicite d'un traumatisme à la tête : - Choc direct ou indirect à la tête - Ou mécanisme de type « whiplash » : mouvement violent d'accélération/décélération de la tête. (2) Un score de Glasgow entre 13 et 15, 30 minutes après le traumatisme ou au moment de la prise en charge à l'hôpital. (3) Au moins un des éléments suivants : une amnésie post-traumatique de moins de 24 heures, confusion ou désorientation, perte de conscience pendant 30 min ou moins et/ou des lésions intracrâniennes retrouvées au scanner mais ne nécessitant pas d'intervention neurochirurgicales. Les dossiers sans aucun critère de définition du TCL de l'OMS mais avec une description explicite de traumatisme à la tête (non-superficiel) pourraient être considérés comme des cas possibles. Schéma : présentation des différentes étapes conduisant au classement des dossiers en cas certains, cas possibles et non-cas de TCL. + Passage en revue par les investigateurs de 200 dossiers de non-cas de TCL. - Si aucun cas de TCL n'est retrouvé parmi ces dossiers classés en non-cas => passage à l'étape 3. - Si un ou plusieurs cas de TCL sont retrouvés parmi ces dossiers de non-cas=> retour à l'étape 2 en appliquant une liste de mots clés réajusté. Application des algorithmes de sélection des cas sur les données d'OSCOUR Les algorithmes de sélection des cas de TCL déterminés à l'axe 1 seront appliqués sur les données d'OSCOUR® pour l'année 2019. Des variables binaires seront construites pour chaque algorithme afin de distinguer les « cas » et les « non-cas » dans la base OSCOUR®. Les RPU avec au moins un code CIM-10 de l'algorithme considéré seront classés comme étant des « cas » dans OSCOUR® et les RPU ne contenant aucun code CIM-10, de l'algorithme, seront considérés comme des « non-cas » dans OSCOUR®. Etude des qualités métrologiques des algorithmes de sélection des TCL dans OSCOUR® Les RPU classés par les algorithmes en cas et non-cas dans la base OSCOUR® seront chainés, grâce au numéro d'identifiant des RPU, aux dossiers correspondant qui auront également été classés en cas et non-cas préalablement. A l'issue de ce chainage il sera possible de déterminer si les cas et non-cas classés par notre/nos algorithme(s) dans OSCOUR® correspondent effectivement à des cas et non-cas au vu des éléments retrouvés dans les dossiers de passages aux urgences. Plus précisément, à cette étape, les vrais positifs, faux positifs, vrais négatifs, faux négatifs seront déterminés. - Les Vrais-Positifs (VP) correspondant aux cas de TCL au vu des éléments retrouvés dans les dossiers de passages aux urgences classés par notre/nos algorithme(s) OSCOUR®, comme étant de cas. - Les Faux-Positifs (FP) correspondant aux non-cas de TCL au vu des éléments retrouvés dans les dossiers de passages aux urgences classés par notre/nos algorithme(s) OSCOUR®, comme étant des cas. - Les Vrais-Négatifs (VN) correspondant aux non-cas de TCL au vu des éléments retrouvés dans les dossiers de passages aux urgences classés par notre/nos algorithme(s) OSCOUR®, comme étant des non-cas. - Les Faux-Négatifs (FN) correspondant aux cas de TCL au vu des éléments retrouvés dans les dossiers de passages aux urgences classés par notre/nos algorithme(s) OSCOUR®, comme étant des non-cas. Pour pouvoir comprendre précisément les sources d'erreurs/d'imprécisions de codage, l'ensemble des informations disponibles dans les dossiers patients des faux-positifs et des faux-négatifs, susceptibles d'expliquer ces erreurs de codage, seront analysées. Cette analyse permettra d'émettre de recommandations pour améliorer le codage des TCL dans OSCOUR®. A partir des effectifs de VP, FP, VN, FN, les différents critères permettant de mesurer les qualités métrologiques de nos algorithmes pourront être calculées : Sensibilité, Spécificité, VPP, VPN : - Dans la cadre de notre étude la sensibilité correspondra à la proportion de cas de TCL identifiés dans les dossiers de passages aux urgences qui auront été classés par notre/nos algorithme(s) comme étant des cas dans OSCOUR®. - La spécificité correspondra dans notre étude à la proportion de non-cas de TCL identifiés dans les dossiers de passages aux urgences qui auront été classés par notre/nos algorithme(s) comme étant des non-cas cas dans OSCOUR®. - La VPP correspondra dans notre étude à la proportion de cas avérés de TCL, au vu des éléments retrouvés dans les dossiers de passages aux urgences, parmi les RPU classés comme étant des cas par notre/nos algorithme(s) dans OSCOUR®. - La VPN correspondra dans notre étude à la proportion non-cas avérés de TCL, au vu des éléments retrouvés dans les dossiers de passages aux urgences, parmi les RPU classés comme étant des non-cas par notre/nos algorithme(s) dans OSCOUR®. Le détail de la façon dont ces différents indicateurs sont calculés est présenté ci-dessous (tableau 1). Tableau 1 : Formule de calcul de la Sensibilité, Spécificité, VPP, VPN des algorithmes de sélection des cas de TCL dans OSCOUR®, Dossier de passages aux urgences : Gold standard Cas Non-cas OSCOUR Cas Vrais-positif Faux-positif VPP=VP/ (VP+FP) Non-cas Faux-négatif Vrai-négatif VPN=VN/ (VN+FN) Sensibilité= VP/ (VP+ FN) Spécificité=VN/ (VN+FP) La sensibilité, la spécificité, la VPP et la VPN seront ensuite calculés en se basant sur la définition restrictive des cas certains et selon une définition plus large incluant les cas certains et les cas possibles. Ces différents critères seront mesurés globalement pour l'ensemble des hôpitaux et déclinés par hôpital et par âge et selon d'autres critères qui pourraient s'avérer pertinents. L'étude de validation fera l'objet du second article de cette thèse. Etude pilote Avant de réaliser l'étude de validation en tant que telle, une étude pilote sera réalisée sur un échantillon de 1000 dossiers de passages aux urgences qui seront ensuite chainés aux données d'OSCOUR®. Cette étude pilote permettra d'affiner la liste de mots clés pour identifier les cas potentiels. L'ensemble de dossiers de non-cas, dossiers non-sélectionnés comme étant des cas potentiels à partir des mots clés, seront analysés afin de s'assurer que ces dossiers sont effectivement des dossiers de non-cas. Cette étude sera utile également pour définir des critères précis pour classer les cas potentiels en cas « certains », cas « possibles » et « non-cas » et pour déterminer la durée nécessaire pour examiner les dossiers. Les enseignements de cette étude pilote permettront de lancer l'étude de validation dans les meilleures conditions. Confidentialité des données L'épidémiologiste de Santé publique France réalisera une sélection aléatoire de RPU dans OSCOUR. Les identifiants des RPU indispensable pour le chainage seront conservées telles quelles. Pour garantir l'anonymisation des données, certaines variables potentiellement identifiantes seront remplacées : le code postal deviendra un numéro de département, la date de naissance sera remplacée par un âge calculé au moment de la prise en charge aux urgences. Un numéro index sera généré pour chaque dossier patient. La consultation du dossier patient informatisé des urgences sera réalisée par un professionnel de santé de l'hôpital ou par un professionnel de Santé publique France sous la supervision d'un membre du DIM de l'hôpital. L'investigateur confirmera ou infirmera la notion de TCL sur la base des critères établis préalablement. Les informations seront collectées dans un fichier informatisé par Santé publique France sous forme cryptée. Ces fichiers seront conservés sur un serveur sécurisé et uniquement accessible aux épidémiologistes en charge de l'analyse. La base de données sera conservée dans ces conditions pendant 6 mois après publication des résultats de l'analyse. Axe 3 : Quantification et caractérisation des victimes et des circonstances de survenue des TCL pris en charge aux urgences Après avoir déterminé et validé un ou plusieurs algorithmes, l'objectif de ce troisième axe de cette thèse sera : 1/ De quantifier et de caractériser les victimes de TCL de tous âges prises en charge aux urgences à partir des données d'OSCOUR® 2/ De décrire les circonstances de survenue des TCL, données indispensables à la mise en place de mesures de prévention, à partir des informations recueillies dans les dossiers de passages aux urgences et à partir des données de l'enquête EPAC. Incidence des TCL aux urgences Un des intérêts d'OSCOUR® est l'actualisation des données en quasi temps-réel permettant d'exploiter des données récentes et avec un taux d'exhaustivité du nombre de passage aux urgences élevé. Ainsi, les analyses pourraient porter sur la période 2017-2021. Le taux d'exhaustivité du nombre de passage aux urgences dépassant les 90 % à partir de 2017. Les résultats seront présentés par année et pour l'ensemble de la période. Après une première description, (nombre de cas sélectionné, sexe, âge, ), des taux d'incidences globaux bruts de victimes de TCL passant aux urgences seront calculés. A partir du taux d'incidence brut calculé, de la sensibilité et de la spécificité déterminé aux cours de l'étude de validation, un taux d'incidence ajusté (prenant en compte le biais de codage dans OSCOUR®) sera calculé en utilisant la méthode proposée par Gladen et Rogan [14]. Des taux d'incidence standardisés seront calculés pour étudier l'évolution temporelle sur une période récente. Des modèles de poisson seront utilisés pour étudier la significativité des tendances temporelles. Etude des inégalités sociales et territoriales Les taux d'incidence seront déclinés à l'échelle regionale/départementale afin d'étudier d'éventuels gradients géographiques. Un chainage, à partir des codes commune, avec les données du FDep (French deprivation index)[15], indice écologique de désavantage social mesuré à l'échelle de la commune, sera également réalisé afin de calculer des taux d'incidence de TCL par quintile de population selon le FDep. Estimation de l'incidence des TCL en population générale Après cette première quantification et description des victimes de TCL pris en charge aux urgences en France, un travail exploratoire sera réalisé afin de tenter de déterminer l'incidence du TCL en population (incluant les cas de TCL recourant aux soins mais également ceux qui ne recourent pas aux soins). L'objectif de cette étude exploratoire sera de déterminer la proportion de cas de TCL qui ne recourent pas aux urgences en France. La détermination de cette proportion sera utilisée ensuite comme facteur correcteur des taux d'incidence de victimes de TCL pris en charge aux urgences pour déduire l'incidence des victimes de TCL en population. Différents scénarios/hypothèses seront envisagés en nous appuyant sur la littérature et sur l'estimation de l'incidence des victimes de TC de 15-85 qui sera calculée à partir des données l'enquête transversale en population générale du baromètre santé 2020. Etude des circonstances de survenue des TCL Dans la mesure où les données relatives au contexte de survenue des TCL sont très peu codées dans OSCOUR®, nous utiliserons deux sources d'informations, pour recueillir ces informations indispensables pour la mise en place de mesures de prévention : les dossiers de cas certains ou possibles de TCL qui auront été identifiés pendant l'étude de validation et les données de l'enquête EPAC recueil exhaustif et continu de données épidémiologiques sur des personnes victimes d'accident de la vie courante dans 10 services d'urgence en France métropolitaine-. Selon notre hypothèse, nous devrions avoir plus de 100 dossiers de cas certains ou possibles à l'issue de l'étude de validation. Nous avons estimé qu'il serait nécessaire, pour pouvoir réaliser des analyses suffisamment détaillées sur les circonstances à partir des dossiers de passages aux urgences, de disposer d'au moins 400 dossiers de cas de TCL certains et possibles. Par conséquent, il sera très probablement nécessaire de compléter notre échantillon par environ 300 dossiers supplémentaires. Ces dossiers seront sélectionnés dans les 4 services d'urgences participant à l'étude de validation. Pour identifier les dossiers de cas possibles ou certains nous commencerons par sélectionner des RPU de cas de TCL avec l'algorithme présentant les meilleures qualités métrologiques. Les dossiers correspondant à des RPU de cas selon notre algorithme seront ensuite sélectionnés. Enfin, des informations sur les circonstances seront extraites des dossiers de cas certains ou possibles que nous aurons identifiés à l'aide des critères utilisés pour l'étude de validation (cf plus haut). Sur cet échantillon de 400 dossiers de passages aux urgences, des informations sur le mécanisme (chutes, accident de la circulation, choc,..), l'intentionnalité ou la consommation de substances psychoactives (alcool, drogues) seront recherchées. En complément de cette analyse, dans la mesure où les TCL surviennent le plus fréquemment dans un contexte d'accident de la vie courante (AcVC) (accident domestiques, de sport, de loisirs, ) les données de l'enquête EPAC seront également utilisées pour décrire précisément les circonstances de survenue des TCL par AcVC. A partir de ces deux sources de données (EPAC et les dossiers de passages aux urgences) une première description globale des circonstances sera réalisée et ensuite les circonstances seront décrites selon le sexe et l'âge. L'ensemble des résultats des analyses sera décrit à l'aide des critères de mesure de distribution tel que la médiane avec le 1er et le 3ème quartile pour les variables quantitatives et pour les variables qualitatives, les effectifs, les proportions avec leurs intervalles de confiance à 95% seront présentées. Les résultats retrouvés sur les AcVC à partir de ces différentes sources (EPAC, dossiers de passages aux urgences), seront comparées à l'aide de tests adéquats (test du chi2 ou test exact de fisher pour les variables qualitatives et le test de student pour les variables quantitatives). Conventionnellement le seuil de significativité des tests sera fixé à 0,05. Les analyses seront réalisées à l'aide du logiciel SAS Entreprise Guide 7.4. Les résultats de ces analyses donneront lieu à la réalisation du troisième article de cette thèse.