Thèse en cours

Approches statistiques en pharmacoépidémiologie pour la prise en compte de facteurs de confusion indirectement mesurés dans les bases médico-administratives

FR  |  
EN
Auteur / Autrice : Chi hong Duong
Direction : Pascale Tubert-Bitter
Type : Projet de thèse
Discipline(s) : Epidémiologie
Date : Inscription en doctorat le 01/10/2020
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Santé Publique (Le Kremlin-Bicêtre, Val-de-Marne ; 2015-...)
Partenaire(s) de recherche : Laboratoire : Centre de Recherche en épidémiologie et Santé des populations
Equipe de recherche : Biostatistique en grande dimension
référent : Université Paris-Saclay. Faculté de médecine (Le Kremlin-Bicêtre, Val-de-Marne ; 2020-....)

Résumé

FR  |  
EN

L'ouverture des bases médico-administratives pour la recherche biomédicale a considérablement modifié le paysage de la pharmacoépidémiologie, cette dernière visant à étudier l'impact des médicaments dans la population. En France, le système national des données de santé (SNDS) contient pour la quasi-totalité de la population française l'ensemble des actes de soins remboursés (délivrance de médicaments, consultations etc.) et des hospitalisations. Malgré leur très grande richesse, ces bases de remboursement présentent un certain nombre de limites pour la conduite d'études pharmacoépidémiologiques. Une première est liée au fait qu'elles ne contiennent que des actes remboursés. Plus généralement, ces bases à visée administrative, ne contiennent que très peu d'informations “directes” concernant l'état de santé des individus ; en particulier des facteurs de risque aussi classiques que le tabagisme ou l'obésité ne sont pas directement accessibles. L'état de santé ou les facteurs de risque d'un patient doivent donc être inférés à partir des informations enregistrées dans la base tels que la délivrance de médicaments, les codes d'hospitalisation ou d'actes médicaux. Dans les études de pharmacoépidémiologie classiques, la confusion induite par des facteurs de risque mesurés sur une association [pathologie, exposition médicamenteuse] est généralement prise en compte au moyen de modèles de régression intégrant ces facteurs de risque ou de scores de propension, ces derniers modélisant la probabilité d'être exposé au médicament d'intérêt. Pour les études pharmacoépidémiologiques conduites sur les bases médico-administratives, la confusion induite par des facteurs de risque non mesurés peut être source de biais et il est donc nécessaire de proposer des stratégies d'analyse permettant d'amoindrir ce dernier autant que possible et de quantifier son impact. L'objectif général de ce projet de thèse est d'évaluer un certain nombre de méthodes qui ont été proposées ces dernières années pour appréhender cette confusion non directement mesurée. Le cadre d'application sera celui des bases médico-administratives. Nous nous intéresserons plus particulièrement à quatre stratégies : 1) les régressions multivariées pénalisées, 2) les scores en grande dimension, 3) le targeted maximum likelihood estimator (TMLE), 4) les e-values. Nous débuterons ce projet de recherche par une recherche bibliographique afin d'identifier d'éventuelles approches supplémentaires. Un premier axe de travail pourrait donc consister à évaluer sur une ou deux associations de référence un certain nombre de méthodes proposées classiquement dans la littérature telles que le score de propension en grande dimension ou les e-values. Un deuxième axe de recherche pourrait porter sur l'étude d'approches plus récentes telles que le TMLE ou les scores pronostiques en grande dimension. Il pourrait aussi consister à proposer certaines extensions des méthodes identifiées. Par exemple, il pourrait s'agir de proposer une extension de l'utilisation conjointe du score de propension et du score pronostique (Leacy and Stuart 2014) à la grande dimension. Concernant les e-values, il pourrait s'agir de s'intéresser à l'extension de ce type d'approches à plusieurs facteurs de risque. Dans un troisième axe, les méthodes retenues à l'issue des deux premiers axes de recherche pourraient être utilisées dans le cadre d'une pharmacoépidémiologique portant sur une association moins documentée. Il s'agira de venir en complément des analyses classiquement effectuées sur ce type de données.