Contributions à la modélisation générative et à l'apprentissage de dictionnaire : théorie et application
Auteur / Autrice : | Michaël Allouche |
Direction : | Emmanuel Gobet, Stéphane Girard |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 09/12/2022 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....) |
Laboratoire : Centre de mathématiques appliquées (Palaiseau, Essonne) | |
Jury : | Président / Présidente : Blanka Horvath |
Examinateurs / Examinatrices : Emmanuel Gobet, Stéphane Girard, Chen Zhou, Ralf Korn, Marylou Gabrié | |
Rapporteurs / Rapporteuses : Chen Zhou, Ralf Korn |
Résumé
Cette thèse vise à étudier les méthodes basées sur les données dans les paradigmes de l'intelligence artificielle et du Machine Learning. Bien que très populaires, ces méthodes sont principalement utilisées dans des travaux empiriques. Par conséquent, fournir des directives théoriques pour la construction de tels modèles est d'une importance primordiale.Dans la première partie, nous étudions la modélisation générative à l'aide de réseaux de neurones dans deux contextes différents : la simulation d'un mouvement Brownien fractionnaire et de lois à queue lourde dans les cas conditionnels et non conditionnels. Dans tous les travaux, nous analysons la vitesse de convergence de l'erreur uniforme entre la fonction d'intérêt et son approximation par réseaux de neurones. Les performances de nos modèles sont illustrées au travers de simulations et de problèmes réels en finance et en météorologie : génération de rendements négatifs extrêmes d'indices financiers et de précipitations en fonction de leur localisation géographique.Dans la deuxième partie, nous proposons une nouvelle méthode basée sur l'apprentissage par dictionnaire pour la modélisation des matrices de migration des notations financières. Nous devons fare face à une faible quantité de données, proche de la dimension du problème, une évolution rapide dans le temps des matrices et une collection de contraintes linéaires. Nous présentons une étude numérique avec des données réelles et montrons la performance du modèle comme indicateur de sentiment économique.