Apprentissage de la causalité par machine learning pour l'analyse et la prédiction du comportement client
Auteur / Autrice : | Mouad El bouchattaoui |
Direction : | Paul-Henry CournÈde |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques appliquées |
Date : | Inscription en doctorat le 01/09/2021 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale INTERFACES : approches interdisciplinaires, fondements, applications et innovation |
Partenaire(s) de recherche : | Laboratoire : Mathématiques et Informatique pour la Complexité et les Systèmes - EA 4037 |
Référent : CentraleSupélec |
Résumé
Cette thèse aborde l'inférence causale et l'apprentissage de représentations causales (CRL) pour des données de haute dimension et évolutives dans le temps, avec des applications dans des domaines tels que la médecine de précision, le marketing et la vente au détail. La première contribution introduit le Causal Dynamic Variational Autoencoder (CDVAE), un modèle conçu pour estimer les Effets de Traitement Individuels (ITE) en capturant l'hétérogénéité non observée dans les réponses aux traitements, due à des facteurs de risque latents. Contrairement aux approches traditionnelles qui supposent que tous les variables confondantes sont observées, CDVAE se concentre sur les variables non observées influençant la séquence des réponses. Grâce à des garanties théoriques en termes d'identifiabilité et de bornes de généralisation sur l'estimation des ITE, CDVAE atteint des performances proches de celles d'un oracle, surpassant les modèles actuels de pointe sur des ensembles de données synthétiques et semi-synthétiques. La deuxième contribution traite du défi de l'estimation des effets de traitement à long terme à travers une approche de régression contrefactuelle dans le temps, en privilégiant l'efficacité computationnelle et la précision des prévisions à long terme. En s'appuyant sur des Réseaux de Neurones Récurrents (RNN) améliorés avec le Codage Prédictif Contrastif (CPC) et la Maximisation de l'Information (InfoMax), le modèle capture les dépendances à long terme en présence de variables confondantes évolutives sans avoir recours aux architectures de transformers. Ce cadre réalise des réponses de pointe en estimation contrefactuelle sur des ensembles de données synthétiques et réelles et constitue la première intégration du Codage Prédictif Contrastif dans l'inférence causale. La troisième contribution aborde l'apprentissage de représentations causales dans des données complexes et de haute dimension. Pour améliorer la transparence des modèles causaux, nous proposons un cadre flexible qui relie les abstractions causales latentes aux données observables. En introduisant des contraintes de parcimonie structurelle et des structures de regroupement, nous améliorons l'interprétabilité, permettant une compréhension plus nuancée des facteurs causaux latents dans des ensembles de données réelles. Appliquée aux données d'achats de Saint-Gobain et aux données médicales de MIMIC III, notre approche démontre l'efficacité du regroupement de sous-espaces parcimonieux pour l'interprétabilité du modèle.