Thèse soutenue

Impacts des données manquantes sur la gestion des risques

FR  |  
EN
Auteur / Autrice : Patricia Dos Santos
Direction : Jean-Paul Laurent
Type : Thèse de doctorat
Discipline(s) : Sciences de gestion
Date : Soutenance le 20/12/2021
Etablissement(s) : Paris 1
Ecole(s) doctorale(s) : École doctorale de Management Panthéon-Sorbonne (Paris ; 2012-....)
Partenaire(s) de recherche : Laboratoire : Pôle de recherche interdisciplinaire en sciences du management (Paris) (2006-....)
Jury : Président / Présidente : Yannick Malevergne
Examinateurs / Examinatrices : Julie Josse, Michel Crouhy, Adil Reghai
Rapporteur / Rapporteuse : Jean-David Fermanian, Christian Yann Robert

Résumé

FR  |  
EN

Face à un contexte réglementaire toujours plus contraignant, les banques ont dû s’adapter en mettant en œuvre de nombreux moyens afin de répondre aux exigences liées à la qualité de la donnée. En effet, le régulateur a pris conscience que l’évaluation des risques ne pouvait se faire sans des données de bonne qualité, c’est pourquoi les réglementations récentes traitent de plus en plus, directement ou indirectement, de la gestion des données et notamment de la gestion des données manquantes. C’est pourquoi les banques s’intéressent aux méthodes d’imputation, à leur efficacité et surtout à leur impact sur la gestion du risque. Ainsi, cette thèse présente les enjeux généraux liés aux données manquantes, avant de se focaliser sur le cas financier et, en particulier, sur les implications réglementaires, pour ensuite mener une analyse comparative basée sur plusieurs critères (moments statistiques, mesures de proximité, matrice de covariance, mesures de risque et temps de calcul). L’analyse comparative est effectuée à partir de nombreuses méthodes d’imputation, telles que l’interpolation linéaire ou le LOCF, qui seront utilisées comme modèles de référence, ainsi que du pont brownien, des K-NN, MSSA, des forêts aléatoires, Amelia, MICE, IPCA et MIPCA. Ainsi, ces méthodes ont été appliquées à des échantillons simulés où les données ont été supprimées de l’échantillon selon un mécanisme MCAR, MAR ou MNAR, mais également à des échantillons historiques avec des données MCAR. Si cette analyse comparative révèle des résultats particulièrement satisfaisants pour l’algorithme d’Amélia et les forêts aléatoires, elle révèle également de nombreux points critiques pour les banques mais aussi pour le régulateur.