Thèse soutenue

Sujets en Inférence Causale et Apprentissage de Politiques avec Applications à la Médecine de Précision

FR  |  
EN
Auteur / Autrice : Pan Zhao
Direction : Julie JosseAntoine Chambaz
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 04/09/2024
Etablissement(s) : Université de Montpellier (2022-....)
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut Desbrest d’Épidémiologie et de Santé Publique (Montpellier)
Jury : Président / Présidente : Fabrizia Mealli
Examinateurs / Examinatrices : Stefan WAGER, Stijn Vansteelandt
Rapporteur / Rapporteuse : Alex LUEDTKE, Agathe Guilloux

Résumé

FR  |  
EN

La causalité est un concept fondamental en science et en philosophie. Dans un contexte où la collecte massive de données de grande complexité s’impose dans tous les domaines, les statistiques jouent un rôle crucial dans l'inférence des causes et des effets. Cette thèse explore des méthodes avancées d'inférence causale. Elle met l'accent sur l'apprentissage de politiques d’action (“politiques” dans la suite), les variables instrumentales (IV), et les approches de différences en différences (DiD).Les méthodes IV et DiD sont utilisées par les chercheurs en épidémiologie, médecine, biostatistique, économétrie et sciences sociales quantitatives. Elles reposent sur des hypothèses restrictives, telles que, d’une part, l'exigence que l'IV n’ait aucun effet direct sur le résultat autre qu’à travers le traitement et, d’autre part, l'hypothèse de tendances parallèles en DiD, qui peut être violée en présence de confusion non mesurée.Dans ce contexte, cette thèse propose une approche innovante de DiD instrumentalisée pour l'apprentissage de politiques. Cette combinaison permet de relâcher certaines des hypothèses clés des méthodes IV et DiD conventionnelles. Des résultats d'identification novateurs pour les politiques optimales en présence de confusion non mesurée sont établis, et une gamme d'estimateurs (de Wald ; par pondération inverse des probabilités ; semi-paramétriques efficaces et multiplement robustes) sont introduits. Des garanties théoriques multiplement robustes sont fournies, incluant le taux cubique de convergence pour les politiques paramétriques et une inférence statistique valide avec des algorithmes de machine learning (ML) flexibles pour l'estimation des paramètres de nuisance. Ces méthodes sont en outre étendues à la configuration de données de panel.La majorité des méthodes d'inférence causale dans la littérature dépendent fortement de trois hypothèses causales standard pour identifier les effets causaux et les politiques optimales. Bien que des progrès aient été réalisés pour relâcher les hypothèses de consistance et de non-confusion, les avancées pour traiter les violations de l'hypothèse de positivité sont restées limitées.Dans ce contexte, cette thèse présente un cadre novateur d'apprentissage des politiques qui ne repose pas sur l'hypothèse de positivité, se concentrant plutôt sur des politiques dynamiques et stochastiques pratiques pour des applications réelles. Des politiques de score de propension incrémentale, ajustant les scores de propension par des paramètres individualisés, sont proposées. Leur analyse ne met en jeu que les hypothèses de consistance et de non-confusion. Ce cadre améliore le concept d'effets d'intervention incrémentale, l'adaptant aux contextes de politique de traitement individualisée, et utilise la théorie semi-paramétrique pour développer des fonctions d'influence efficaces et des estimateurs ML dédiés. Des méthodes pour optimiser les politiques en maximisant la fonction de valeur sous des contraintes spécifiques sont également introduites.De plus, le régime de traitement individualisé optimal (ITR) appris d'une population source peut ne pas se généraliser bien à une population cible en raison des décalages de covariables. Un cadre d'apprentissage par transfert est proposé pour l'estimation de l'ITR dans des populations hétérogènes avec des données de survie censurées à droite, que l’on rencontre fréquemment dans les études cliniques. Un estimateur doublement robuste pour la fonction de valeur ciblée est proposé, qui accommode une large classe de fonctionnelles de distributions de survie. Pour une classe pré-spécifiée d'ITRs, un taux cubique de convergence pour le paramètre estimé indexant l'ITR optimal est établi. L'utilisation de procédures de cross-fitting (ajustement croisé) assure la consistance et la normalité asymptotique de l'estimateur de valeur optimal proposé, y compris lorsque l’on a recours à des méthodes ML flexibles pour estimer des paramètres de nuisance.