Thèse en cours

Découverte causale basée sur les données mixtes
FR  |  
EN
Auteur / Autrice : Lei Zan
Direction : Éric Gaussier
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/09/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique de Grenoble
Equipe de recherche : AMA

Résumé

FR  |  
EN

La découverte causale à partir de séries temporelles est un problème clé dans la science et l'ingénierie, en particulier lorsque les interventions expérimentales sont irréalisables ou contraires à l'éthique. Les mécanismes de causalité peuvent opérer sur des événements, comme le fait que la valeur d'un capteur dépasse un seuil donné, ou sur des processus pour lesquels on s'intéresse directement aux valeurs des capteurs. Dans le premier cas, la cause est qualitative/discrète (tout comme les variables et données associées) alors que dans le deuxième elle est quantitative/continue. Il existe beaucoup de situations dans lesquelles il est important de considérer des variables discrètes et continues. Ainsi, un flot de données sur un réseau (variable continue) peut entraîner l'utilisation d'une mémoire (RAM par exemple) qui, lorsqu'elle dépasse un certain seuil (variable discrète associée au dépassement), ralentit le système d'exploitation. Parmi les modèles les plus populaires d'inférence causale, on trouve la méthode de Granger qui a l'avantage de la simplicité. Elle a toutefois le désavantage de ne s'appliquer qu'à des données continues et de reposer sur des hypothèses de linéarité non satisfaites en pratique. Elle ne fournit de plus pas un graphe causal au sens strict du terme. Les approches à base de contraintes reviennent sur ces défauts. Ces méthodes sont non paramétriques et évitent ainsi les hypothèses parfois non réalistes faites dans les approches fondées sur l'analyse du bruit. Nous avons récemment développé une nouvelle méthode d'inférence à base de contraintes qui s'appuie sur l'information mutuelle afin d'estimer les dépendances entre variables. Cette méthode conserve les garanties théoriques classiques des approches à base de contraintes et permet de traiter des séries temporelles avec des fréquences d'échantillonnage différentes. Elle fournit de plus des graphes de meilleure qualité que ceux obtenus avec des méthodes concurrentes. Elle a toutefois été pensée pour des variables continues et son extension à des variables discrètes reste à définir. Ce dernier point constitue le principal objet de la thèse.