Approches statistiques causales en grande dimension pour la détection de signaux en pharmacovigilance : application aux notifications spontanées et aux données médico-administratives
Auteur / Autrice : | Etienne Volatier |
Direction : | Pascale Tubert-Bitter, Ismaïl Ahmed |
Type : | Thèse de doctorat |
Discipline(s) : | Biostatistiques et data sciences |
Date : | Soutenance le 24/01/2024 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Santé Publique |
Partenaire(s) de recherche : | Laboratoire : Centre de recherche en épidémiologie et santé des populations (Villejuif, Val-de-Marne ; 2010-....) |
référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....) | |
graduate school : Université Paris-Saclay. Graduate School Santé publique (2020-....) | |
Jury : | Président / Présidente : Philippe Broët |
Examinateurs / Examinatrices : Antoine Chambaz, Anne-Sophie Jannot, Mounia Nacima Hocine | |
Rapporteurs / Rapporteuses : Antoine Chambaz, Anne-Sophie Jannot |
Mots clés
Résumé
La détection de signal est une première étape d'analyse de données exploratoire fondamentale pour la pharmacovigilance, le but final étant de suivre et d'évaluer la sécurité du médicament une fois sa mise sur le marché. Les bases de données utilisées aujourd'hui pour la détection de signal sont essentiellement les bases de notifications spontanées mais récemment l'utilisation des bases médico-administratives a été pro-posée. Devant le nombre croissant de notifications spontanées ainsi que la grande taille des bases médico-administrative en termes de nombre d'individus et de nombre de variables mesurées, la mise en place d'approches statistiques adaptées à la grande dimension est devenue essentielle.La présence de facteurs de confusion souvent non mesurés, la poly-exposition et la grande dimension des expositions rendent néanmoins l'analyse complexe. Pour faire face à ces difficultés, nous proposons plu-sieurs méthodes issues de l'inférence causale en grande dimension pour la détection de signal appliquée sur les bases de notifications spontanées et les bases médico-administratives. Cette approche causale permet de tirer parti de modèles non paramétriques tels que les arbres de régression boostés pour l'ajustement aux données. Nous offrons ainsi des solutions alternatives aux méthodes linéaires généralisées avec pénalité LASSO couramment utilisées pour l'analyse de données en grande dimension. Nous intégrons à nos propositions des outils comme le score de propension en grande dimension, les études autocontrôlées ainsi que la g-computation et l'apprentissage ciblé.Nos résultats obtenus à la fois par simulations et sur données réelles suggèrent que les approches proposées offrent des alternatives compétitives aux approches basées sur le LASSO. Par ailleurs, deux applications pour l'infarctus du myocarde et les lésions hépatiques aiguës ont pu mettre en évidence plusieurs signaux pertinents.