Thèse soutenue

Inférence causale sur données observationnelles : développement et application pour les soins critiques

FR  |  
EN
Auteur / Autrice : Maxime Leger
Direction : Yohann FoucherSigismond Lasocki
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 13/05/2022
Etablissement(s) : Nantes Université
Ecole(s) doctorale(s) : École doctorale Biologie-Santé (Nantes)
Partenaire(s) de recherche : Laboratoire : SPHERE (Nantes ; Tours)
Jury : Président / Présidente : Sophie Hamada
Examinateurs / Examinatrices : Emilie Lanoy, Antoine Roquilly
Rapporteurs / Rapporteuses : Sophie Hamada, David Hajage

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

L’augmentation croissante des données observationnelles, notamment dans les services de soins critiques amènent à considérer l’utilisation des méthodes statistiques d’inférence causale. Cette thèse présente deux travaux permettant de mettre en lumière les défis actuels de ces méthodes statistiques appliquées sur des données observationnelles de santé. Le premier travail évalue l’impact des barbituriques dans une population de patients traumatisés crâniens, inclus de manière prospective dans la cohorte ouverte de soins critiques AtlanRéa. L’évaluation de l’impact des barbituriques a été permis par le respect des hypothèses de l’inférence causale et l’utilisation d’une méthode basée sur les scores de propension : la pondération. Au-delà du résultat de cette analyse, ayant notamment mis en évidence une augmentation de la mortalité dans le groupe traité par barbituriques, nous avons été confrontés à la problématique de l’infraction de l’hypothèse de positivité. Nous avons ensuite comparé différentes méthodes statistiques d’inférence causale dans un contexte d’infraction de l’hypothèse de positivité, pouvant être associée à la problématique d’extrapolation. Les méthodes prédisant la survenue de l’évènement sont les plus robustes dans ces situations. Dans ce contexte d’accumulation de données de santé, une perspective d’optimisation de l’utilisation des méthodes statistiques dans le cadre de l’inférence résidera dans le recours aux algorithmes d’apprentissage automatisé (machine learning) pour éviter les problèmes de spécification des modèles.