Thèse soutenue

Généralisation d'un effet causal depuis une étude randomisée vers une population cible : contributions théoriques et méthodologiques

FR  |  
EN
Auteur / Autrice : Bénédicte Colnet
Direction : Julie JosseErwan ScornetGaël Varoquaux
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 28/06/2023
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Centre de mathématiques (Palaiseau, Essonne ; ....-2004) - Centre de mathématiques appliquées de l'Ecole polytechnique (Palaiseau ; 1974-....)
établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....)
Jury : Président / Présidente : Erwan Le Pennec
Examinateurs / Examinatrices : Julie Josse, Erwan Scornet, Stijn Vansteelandt, Nicolai Meinshausen, Elizabeth Ogburn, Trevor J. Hastie
Rapporteurs / Rapporteuses : Stijn Vansteelandt, Nicolai Meinshausen

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La médecine moderne, aussi dite médecine fondée sur les preuves, place les essais contrôlés randomisés (ECRs) au premier plan de la preuve clinique. En effet, la randomisation permet une estimation de l'effet causal du traitement, dépassant la simple association ou corrélation.Cependant, de plus en plus de limites sont trouvées aux ECRs, du fait de leurs stricts critères d'éligibilité, des conditions de réalisation, des périodes de temps trop restreintes qu'ils couvrent, ou encore de leur petite taille d'échantillon.Toutes ces raisons entament ce que l'on appelle la validité externe des résultats.L'utilisation de données observationnelles ou dites de vie réelle constitue une potentielle solution. Les autorités sanitaires comme le régulateur américain (Food and Drug Administration) ou encore la Haute Autorité de la Santé (HAS) soutiennent ces nouvelles pratiques. Mais les données de vie réelle ne sont pas non plus une panacée, car leur analyse repose sur des hypothèses non vérifiables pour la plupart. Des travaux plus récents proposent de combiner les deux sources de données, afin de renforcer les faiblesses de l'une par les forces de l'autre. Ainsi, cette thèse propose d'abord une revue de toutes les méthodes existantes sur le sujet, que ce soit pour déconfondre une base de données observationnelles à partir de données expérimentales ou bien pour généraliser à d'autres populations une étude randomisée. Ce travail de thèse propose ensuite d'approfondir ce dernier aspect, en utilisant la représentativité des données de vie réelle pour re-pondérer les résultats d'un ECR. Cette thèse étudie les propriétés théoriques de ces méthodes, telles que les propriétés d'estimation à taille finie ou asymptotique (biais et variance). Ces résultats permettent d'obtenir des recommandations pratiques pour la recherche clinique, notamment concernant la sélection de covariables. Cette thèse propose également une analyse de sensibilité lorsque les covariables sont partiellement ou totalement observées.La plupart des travaux existants définissent l'effet d'un traitement comme une différence absolue. Pourtant, d'autres métriques, comme le ratio, sont préférées dans la recherche clinique. Par conséquent, cette thèse ouvre également la voie à la généralisation de toutes les mesures causales, et non pas seulement de l'une d'entre elles. Ce faisant, nous relions la généralisation à une préoccupation plutôt ancienne de la causalité, à savoir la collapsibilité d'une mesure. Nous proposons également une autre façon d'appréhender ce que l'on appelle l'hétérogénéité d'un effet. Ceci nous permet de montrer que les méthodes pour généraliser un effet causal dépendent de la nature de l'outcome (continu ou binaire) ainsi que de la nature de la mesure d'intérêt (ratio ou différence).Tous les travaux de cette thèse sont développés en lien avec la recherche clinique, notamment via le consortium français de la Traumabase.