Thèse soutenue

Approche basée sur l'apprentissage d'ensemble pour le portefeuille global minimum variance

FR  |  
EN
Auteur / Autrice : Anh-Tuan Tran
Direction : Marc Bui
Type : Thèse de doctorat
Discipline(s) : Informatique, mathématique et applications
Date : Soutenance le 20/03/2024
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale de l'École pratique des hautes études (Paris)
Partenaire(s) de recherche : Établissement de préparation de la thèse : École pratique des hautes études (Paris ; 1868-....)
Laboratoire : Cognitions humaine et artificielle (Saint-Denis)
Jury : Président / Présidente : Isis Truck
Examinateurs / Examinatrices : Marc Bui, Mhand Hifi, Soufian Ben Amor, Duc Pham-Hi, Vu Duong
Rapporteurs / Rapporteuses : Mhand Hifi, Soufian Ben Amor

Résumé

FR  |  
EN

Ensemble Learning a une idée simple selon laquelle la combinaison de plusieurs algorithmes d'apprentissage a tendance à donner un meilleur résultat que n'importe quel algorithme d'apprentissage unique. Empiriquement, la méthode d'ensemble est meilleure si ses modèles de base sont diversifiés même s'il s'agit d'algorithmes aléatoires non intuitifs tels que des arbres de décision aléatoires. En raison de ses avantages, Ensemble Learning est utilisé dans diverses applications telles que les problèmes de détection de fraude. Plus en détail, les avantages d'Ensemble Learning tiennent à deux points : i) combine les points forts de ses modèles de base afin que chaque modèle soit complémentaire l'un de l'autre et ii) neutralise le bruit et les valeurs aberrantes parmi tous les modèles de base puis réduit leurs impacts sur le prévisions finales. Nous utilisons ces deux idées d'Ensemble Learning pour différentes applications dans les secteurs de l'apprentissage automatique et de la finance. Nos principales contributions dans cette thèse sont : i) traiter efficacement un scénario difficile de problème de données de déséquilibre dans l'apprentissage automatique, qui est un problème de données volumineuses extrêmement déséquilibré en utilisant la technique de sous-échantillonnage et l'apprentissage d'ensemble, ii) appliquer de manière appropriée la validation croisée des séries chronologiques et l'Ensemble Learning pour résoudre un problème de sélection d'estimateur de matrice de covariance dans le trading quantitatif et iii) réduire l'impact des valeurs aberrantes dans les estimations de la matrice de covariance afin d'augmenter la stabilité des portefeuilles en utilisant le sous-échantillonnage et l'Ensemble Learning.