Apprentissage de représentation de graphes et applications à la modélisation des marchés financiers
Auteur / Autrice : | Ashraf Ghiye |
Direction : | Michalis Vazirgiannis |
Type : | Projet de thèse |
Discipline(s) : | Informatique, données, IA |
Date : | Inscription en doctorat le 01/07/2022 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | Laboratoire : LIX - Laboratoire d'informatique |
Equipe de recherche : PARTOUT |
Résumé
Un des défis majeurs que nous rencontrons régulièrement dans les métiers de Global Market est de savoir comment mixer dans un même modèle des sources de données différentes, sur des discrétisation temporelle différente et de nature différente : par exemple, comment mixer des séries temporelles de prix de marché avec des interactions clients, que ce soit des trades, des requêtes de prix ou d'autres informations non-structurées telles que des conversations ou des lectures de documents publiés par des analystes. L'apprentissage de représentations sur graphes devrait pouvoir répondre à ces questions, en représentant chaque point de ces grands graphes d'interaction dans un espace de dimension inférieure (embeddings). Une telle représentation nous permettrait de tirer parti des méthodes modernes d'apprentissage automatique pour résoudre les défis du marché. Nous pensons que cette approche aura de nombreuses applications du côté du trading en nous permettant de mieux modéliser la dynamique du marché, de prévoir les marchés et de développer de meilleures stratégies de trading. Mais également du côté de la vente en nous permettant de mieux comprendre ce qui motive les transactions des clients afin de recommander de meilleurs produits financiers qui répondent à leurs besoins. L'objectif principal de la thèse sera donc (1) de définir de nouvelles représentations graphiques de divers problèmes de marchés financiers et (2) de développer de nouvelles méthodologies d'apprentissage automatique sur les graphes afin d'utiliser différents flux de données pour résoudre des problèmes majeurs de recherche quantitative (prédiction de marché, systèmes de recommandation, stratégies d'investissement).