Thèse soutenue

Contrôle stochastique et applications : types de champs moyens et utilités dynamiques
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Chefia Ziri
Direction : Anis MatoussiMohamed MnifMohamed Mrad
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 04/10/2022
Etablissement(s) : Le Mans en cotutelle avec Université de Tunis El Manar
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Laboratoire manceau de mathématiques - Laboratoire Manceau de Mathématiques / LMM
Jury : Examinateurs / Examinatrices : Amel Ben Abda, Caroline Hillairet, Marina Kleptsyna
Rapporteurs / Rapporteuses : Boualem Djehiche, Jean-François Chassagneux

Résumé

FR  |  
EN

Cette thèse est consacrée à l’étude des contrôles stochastiques et leurs applications. Dans le premier chapitre, on a étudié un problème de contrôle linéaire quadratique type mean field dans le cadre avec saut. On a utilisé une approche basée sur une formulation faible du principe d’optimalité des martingales standard dans la théorie du contrôle stochastique afin de prouver l’existence d’un contrôle optimal. Nous avons étendu le résultat trouver pour un modèle du production d’énergies épuisables avec extraction. Dans le deuxième chapitre, on s’est intéressé à la résolution numérique d’un problème des jeux à champ moyen (Mean field Game). La caractérisation des stratégies optimales des agents en interaction est obtenue vie l’étude d’un système d’EDP non linéaires couplées permettant la détermination de la caractéristique de l’agent ainsi que la distribution de ces caractéristiques dans la population. Nous avons présenté un schéma numérique pour déterminer le couple (u,m) associé à la fonction de valeur et à la densité de probabilité, en se basant sur un argument de point fixe du système couplé de l’équation de Hamilton Jacobi Bellman et l’équation Fokker Planck. Nous avons appliqué notre approche pour un exemple linéaire quadratique avec une solution explicite afin de comparer les deux solutions numérique et explicite. Dans le troisième chapitre, on introduit un algorithme pour « prédire » l’utilité dynamique d’un agent en observant ses décisions à des dates discrètes (éventuellement aléatoires). C’est le principe des Robo-advisors qui sont des services de gestion d’investissement en ligne qui utilisent des algorithmes mathématiques pour fournir des services financiers avec un minimum d’intervention humaine. L’idée de ce travail est l’apprentissage de l’utilité dynamique d’un investisseur sur un marché financier avec défauts en utilisant des différentes méthodes de Machine Learning.