Thèse soutenue

Analyse causale de médiation multiple et applications

FR  |  
EN
Auteur / Autrice : Allan Jérolon
Direction : Étienne BirmeléFlora AlarconVittorio Perduca
Type : Thèse de doctorat
Discipline(s) : Mathématiques. Mathématiques appliquées
Date : Soutenance le 04/12/2020
Etablissement(s) : Université de Paris (2019-....)
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : MAP5 - Mathématiques Appliquées à Paris 5
Jury : Président / Présidente : Agathe Guilloux
Examinateurs / Examinatrices : Flora Alarcon, Vittorio Perduca, Agathe Guilloux, Anne Philippe, Nicolas Savy, Antoine Chambaz, Vivian Viallon
Rapporteurs / Rapporteuses : Anne Philippe, Nicolas Savy

Résumé

FR  |  
EN

L'analyse de médiation causale est une méthode statistique permettant d'étudier les mécanismes définissant les relations entre trois entités, la première étant une cause, la deuxième une variable de réponse et la troisième un ensemble de variables intermédiaires, aussi appelés médiateurs. Cette approche est devenue populaire dans différents domaines tels que les biostatistiques, l'épidémiologie et les sciences sociales. Son objectif est de décomposer et quantifier l'effet total d'une cause T sur une variable de réponse Y en un effet direct et un effet indirect à travers le(s)médiateur(s) Mi. Dans un diagramme causal ainsi défini peuvent intervenir des covariables mesurées ou non ayant des effets sur les trois variables T, Y et Mi. Quand plusieurs médiateurs sont impliqués dans le modèle de médiation, il y a trois cas possibles de relation entre ces médiateurs : 1) Les médiateurs sont indépendants conditionnellement au traitement et aux covariables mesurées. 2) Les médiateurs sont dépendants conditionnellement au traitement et aux covariables mesurées sans pour autant que l'un affecte l'autre. 3) Les médiateurs sont liés de façon causale, c'est-à-dire que l'un affecte l'autre. Les contributions de cette thèse portent sur les deux premières configurations. Plus particulièrement, l'état de l'art pour l'estimation des effets indirects individuels des médiateurs est de faire plusieurs analyses de médiation simple en parallèle, un médiateur à la fois. Cette approche conduit à une estimation biaisée de l'effet direct et n'est pas justifiée dans la situation 2) car l'hypothèse nécessaire d'Ignorabilité Séquentielle n'est alors pas vérifiée. Le premier chapitre de la thèse propose de résoudre ce problème par l'estimation de la loi multivariée des médiateurs conditionnellement au traitement et décrit les nouvelles hypothèses sous lesquelles une telle approche est valide. Une méthode d'estimation de l'effet direct et de tous les effets indirects individuels est développée, prenant en compte la corrélation entre les médiateurs. Le second chapitre est dédié à l'analyse de médiation multiple2/6dans le cas où le nombre de médiateurs grandit. Deux stratégies sont explorées. La première repose sur une classification spectrale des médiateurs en blocs indépendants, chaque bloc pouvant être analysé avec l'approche précédente. La seconde, applicable dans des problèmes de grande dimension, repose sur la sélection de médiateurs potentiels à l'aide d'une approche de type Group-LASSO en amont de l'analyse de médiation. Le troisième chapitre présente le packageR multimediate où les trois méthodes précédentes sont implémentées. On y présente l'algorithme d'estimation en fonction des différents types de médiateurs considérés (linéaires, binaires et catégoriels). Le dernier chapitre présente des applications sur des données réelles. D'une part une application en épidémiologie pour quantifier et décomposer l'effet de la thérapie hormonal sur le cancer du sein. D'autre part une application en psychiatrie, où nous analysons les effets des tempéraments affectifs sur l'anorexie mentale