Thèse soutenue

Approches statistiques causales en grande dimension pour la détection de signaux en pharmacovigilance : application aux notifications spontanées et aux données médico-administratives

FR  |  
EN
Auteur / Autrice : Etienne Volatier
Direction : Pascale Tubert-BitterIsmaïl Ahmed
Type : Thèse de doctorat
Discipline(s) : Biostatistiques et data sciences
Date : Soutenance le 24/01/2024
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Santé Publique
Partenaire(s) de recherche : Laboratoire : Centre de recherche en épidémiologie et santé des populations (Villejuif, Val-de-Marne ; 2010-....)
référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....)
graduate school : Université Paris-Saclay. Graduate School Santé publique (2020-....)
Jury : Président / Présidente : Philippe Broët
Examinateurs / Examinatrices : Antoine Chambaz, Anne-Sophie Jannot, Mounia Nacima Hocine
Rapporteurs / Rapporteuses : Antoine Chambaz, Anne-Sophie Jannot

Résumé

FR  |  
EN

La détection de signal est une première étape d'analyse de données exploratoire fondamentale pour la pharmacovigilance, le but final étant de suivre et d'évaluer la sécurité du médicament une fois sa mise sur le marché. Les bases de données utilisées aujourd'hui pour la détection de signal sont essentiellement les bases de notifications spontanées mais récemment l'utilisation des bases médico-administratives a été pro-posée. Devant le nombre croissant de notifications spontanées ainsi que la grande taille des bases médico-administrative en termes de nombre d'individus et de nombre de variables mesurées, la mise en place d'approches statistiques adaptées à la grande dimension est devenue essentielle.La présence de facteurs de confusion souvent non mesurés, la poly-exposition et la grande dimension des expositions rendent néanmoins l'analyse complexe. Pour faire face à ces difficultés, nous proposons plu-sieurs méthodes issues de l'inférence causale en grande dimension pour la détection de signal appliquée sur les bases de notifications spontanées et les bases médico-administratives. Cette approche causale permet de tirer parti de modèles non paramétriques tels que les arbres de régression boostés pour l'ajustement aux données. Nous offrons ainsi des solutions alternatives aux méthodes linéaires généralisées avec pénalité LASSO couramment utilisées pour l'analyse de données en grande dimension. Nous intégrons à nos propositions des outils comme le score de propension en grande dimension, les études autocontrôlées ainsi que la g-computation et l'apprentissage ciblé.Nos résultats obtenus à la fois par simulations et sur données réelles suggèrent que les approches proposées offrent des alternatives compétitives aux approches basées sur le LASSO. Par ailleurs, deux applications pour l'infarctus du myocarde et les lésions hépatiques aiguës ont pu mettre en évidence plusieurs signaux pertinents.