Thèse soutenue

Contributions à la modélisation générative et à l'apprentissage de dictionnaire : théorie et application

FR  |  
EN
Auteur / Autrice : Michaël Allouche
Direction : Emmanuel GobetStéphane Girard
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 09/12/2022
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....)
Laboratoire : Centre de mathématiques appliquées (Palaiseau, Essonne)
Jury : Président / Présidente : Blanka Horvath
Examinateurs / Examinatrices : Emmanuel Gobet, Stéphane Girard, Chen Zhou, Ralf Korn, Marylou Gabrié
Rapporteurs / Rapporteuses : Chen Zhou, Ralf Korn

Résumé

FR  |  
EN

Cette thèse vise à étudier les méthodes basées sur les données dans les paradigmes de l'intelligence artificielle et du Machine Learning. Bien que très populaires, ces méthodes sont principalement utilisées dans des travaux empiriques. Par conséquent, fournir des directives théoriques pour la construction de tels modèles est d'une importance primordiale.Dans la première partie, nous étudions la modélisation générative à l'aide de réseaux de neurones dans deux contextes différents : la simulation d'un mouvement Brownien fractionnaire et de lois à queue lourde dans les cas conditionnels et non conditionnels. Dans tous les travaux, nous analysons la vitesse de convergence de l'erreur uniforme entre la fonction d'intérêt et son approximation par réseaux de neurones. Les performances de nos modèles sont illustrées au travers de simulations et de problèmes réels en finance et en météorologie : génération de rendements négatifs extrêmes d'indices financiers et de précipitations en fonction de leur localisation géographique.Dans la deuxième partie, nous proposons une nouvelle méthode basée sur l'apprentissage par dictionnaire pour la modélisation des matrices de migration des notations financières. Nous devons fare face à une faible quantité de données, proche de la dimension du problème, une évolution rapide dans le temps des matrices et une collection de contraintes linéaires. Nous présentons une étude numérique avec des données réelles et montrons la performance du modèle comme indicateur de sentiment économique.