Approche basée sur l'apprentissage d'ensemble pour le portefeuille global minimum variance
Auteur / Autrice : | Anh-Tuan Tran |
Direction : | Marc Bui |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique, mathématique et applications |
Date : | Soutenance le 20/03/2024 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale de l'École pratique des hautes études (Paris) |
Partenaire(s) de recherche : | Établissement de préparation de la thèse : École pratique des hautes études (Paris ; 1868-....) |
Laboratoire : Cognitions humaine et artificielle (Saint-Denis) | |
Jury : | Président / Présidente : Isis Truck |
Examinateurs / Examinatrices : Marc Bui, Mhand Hifi, Soufian Ben Amor, Duc Pham-Hi, Vu Duong | |
Rapporteurs / Rapporteuses : Mhand Hifi, Soufian Ben Amor |
Résumé
Ensemble Learning a une idée simple selon laquelle la combinaison de plusieurs algorithmes d'apprentissage a tendance à donner un meilleur résultat que n'importe quel algorithme d'apprentissage unique. Empiriquement, la méthode d'ensemble est meilleure si ses modèles de base sont diversifiés même s'il s'agit d'algorithmes aléatoires non intuitifs tels que des arbres de décision aléatoires. En raison de ses avantages, Ensemble Learning est utilisé dans diverses applications telles que les problèmes de détection de fraude. Plus en détail, les avantages d'Ensemble Learning tiennent à deux points : i) combine les points forts de ses modèles de base afin que chaque modèle soit complémentaire l'un de l'autre et ii) neutralise le bruit et les valeurs aberrantes parmi tous les modèles de base puis réduit leurs impacts sur le prévisions finales. Nous utilisons ces deux idées d'Ensemble Learning pour différentes applications dans les secteurs de l'apprentissage automatique et de la finance. Nos principales contributions dans cette thèse sont : i) traiter efficacement un scénario difficile de problème de données de déséquilibre dans l'apprentissage automatique, qui est un problème de données volumineuses extrêmement déséquilibré en utilisant la technique de sous-échantillonnage et l'apprentissage d'ensemble, ii) appliquer de manière appropriée la validation croisée des séries chronologiques et l'Ensemble Learning pour résoudre un problème de sélection d'estimateur de matrice de covariance dans le trading quantitatif et iii) réduire l'impact des valeurs aberrantes dans les estimations de la matrice de covariance afin d'augmenter la stabilité des portefeuilles en utilisant le sous-échantillonnage et l'Ensemble Learning.