Inférence causale sur données observationnelles : développement et application pour les soins critiques
Auteur / Autrice : | Maxime Leger |
Direction : | Yohann Foucher, Sigismond Lasocki |
Type : | Thèse de doctorat |
Discipline(s) : | Biostatistique |
Date : | Soutenance le 13/05/2022 |
Etablissement(s) : | Nantes Université |
Ecole(s) doctorale(s) : | École doctorale Biologie-Santé (Nantes) |
Partenaire(s) de recherche : | Laboratoire : SPHERE (Nantes ; Tours) |
Jury : | Président / Présidente : Sophie Hamada |
Examinateurs / Examinatrices : Emilie Lanoy, Antoine Roquilly | |
Rapporteurs / Rapporteuses : Sophie Hamada, David Hajage |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L’augmentation croissante des données observationnelles, notamment dans les services de soins critiques amènent à considérer l’utilisation des méthodes statistiques d’inférence causale. Cette thèse présente deux travaux permettant de mettre en lumière les défis actuels de ces méthodes statistiques appliquées sur des données observationnelles de santé. Le premier travail évalue l’impact des barbituriques dans une population de patients traumatisés crâniens, inclus de manière prospective dans la cohorte ouverte de soins critiques AtlanRéa. L’évaluation de l’impact des barbituriques a été permis par le respect des hypothèses de l’inférence causale et l’utilisation d’une méthode basée sur les scores de propension : la pondération. Au-delà du résultat de cette analyse, ayant notamment mis en évidence une augmentation de la mortalité dans le groupe traité par barbituriques, nous avons été confrontés à la problématique de l’infraction de l’hypothèse de positivité. Nous avons ensuite comparé différentes méthodes statistiques d’inférence causale dans un contexte d’infraction de l’hypothèse de positivité, pouvant être associée à la problématique d’extrapolation. Les méthodes prédisant la survenue de l’évènement sont les plus robustes dans ces situations. Dans ce contexte d’accumulation de données de santé, une perspective d’optimisation de l’utilisation des méthodes statistiques dans le cadre de l’inférence résidera dans le recours aux algorithmes d’apprentissage automatisé (machine learning) pour éviter les problèmes de spécification des modèles.