Analyse et modélisation des données à haute fréquence sur les marchés financiers en utilisant les processus de Hawkes et les réseaux de neurones
Auteur / Autrice : | Ruihua Ruan |
Direction : | Emmanuel Bacry, Jean-François Muzy |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance le 04/12/2023 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | Ecole doctorale SDOSE (Paris) |
Partenaire(s) de recherche : | Laboratoire : Centre de recherche en mathématiques de la décision (Paris) - Centre de Recherche en Mathématiques de la Décision |
établissement opérateur d'inscription : Université Paris Dauphine-PSL (1968-....) | |
Jury : | Président / Présidente : Marc Hoffmann |
Examinateurs / Examinatrices : Emmanuel Bacry, Jean-François Muzy, Marc Hoffmann, Samuel N. Cohen, Fabrizio Lillo, Sophie Laruelle, Stéphane Gaïffas, Ioane Susitino Patrick Muni Toke, Thomas Deschatre | |
Rapporteurs / Rapporteuses : Samuel N. Cohen, Fabrizio Lillo |
Mots clés
Résumé
Cette thèse est consacrée à l'étude de la microstructure du marché dans les marchés électroniques, en mettant l'accent sur deux sujets clés. Le premier sujet concerne la construction de deux modèles pour les événements de Niveau 1 dans le carnet d'ordres, en utilisant des approches basées sur des modèles statistiques. Le premier modèle consiste en un processus de Hawkes non-linéaire pour modéliser la dynamique du bid-ask spread, appelé le modèle ''State-Dependent Spread Hawkes''. En intégrant les tailles des sauts du spread et sa valeur dans la fonction d'intensité, ce modèle est capable de capturer diverses propriétés statistiques du spread. Le second modèle, appelé ''Hawkes process with shot noise'', est utilisé pour séparer les sources de corrélation endogènes et exogènes entre deux prix d'actifs. Pour ce faire, ce modèle suppose l'existence d'un processus latent (shot noise), représentant des comportements d'agents spécifiques non directement observables sur le marché. Théoriquement, des théorèmes de limite sont démontrés et dans la pratique, l'estimation est facilitée par une technique d'estimation non paramétrique. Le second sujet concerne l'analyse et la caractérisation des comportements des agents sur le marché financier, en utilisant des approches basées sur des réseaux neuronaux profonds. Ce sujet comprend deux tâches. La première tâche consiste à classifier les agents en fonction de leurs ordres passés, grâce à une approche d'apprentissage supervisé. La deuxième tâche vise à apprendre la représentation des comportements des agents, en utilisant un modèle d'apprentissage auto-supervisé fondé sur la triplet loss. Ces représentations apprises nous permettent d'appliquer l'algorithme de clustering K-means pour identifier des types de comportements distincts au sein de chaque groupe et ainsi analyser les comportements des agents.