Thèse soutenue

Algorithmes de machine learning en assurance : solvabilité, textmining, anonymisation et transparence
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Antoine Ly
Direction : Romuald ElieArthur Charpentier
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 19/11/2019
Etablissement(s) : Paris Est
Ecole(s) doctorale(s) : École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication (Champs-sur-Marne, Seine-et-Marne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Analyse et de Mathématiques Appliquées - LAMA
Jury : Président / Présidente : Fabrice Rossi
Examinateurs / Examinatrices : Stéphane Loisel, Donatien Hainaut, Marie Kratz, Alexandre Boumezoued
Rapporteurs / Rapporteuses : Stéphane Loisel, Donatien Hainaut

Résumé

FR  |  
EN

En été 2013, le terme de "Big Data" fait son apparition et suscite un fort intérêt auprès des entreprises. Cette thèse étudie ainsi l'apport de ces méthodes aux sciences actuarielles. Elle aborde aussi bien les enjeux théoriques que pratiques sur des thématiques à fort potentiel comme l'textit{Optical Character Recognition} (OCR), l'analyse de texte, l'anonymisation des données ou encore l'interprétabilité des modèles. Commençant par l'application des méthodes du machine learning dans le calcul du capital économique, nous tentons ensuite de mieux illustrer la frontrière qui peut exister entre l'apprentissage automatique et la statistique. Mettant ainsi en avant certains avantages et différentes techniques, nous étudions alors l'application des réseaux de neurones profonds dans l'analyse optique de documents et de texte, une fois extrait. L'utilisation de méthodes complexes et la mise en application du Réglement Général sur la Protection des Données (RGPD) en 2018 nous a amené à étudier les potentiels impacts sur les modèles tarifaires. En appliquant ainsi des méthodes d'anonymisation sur des modèles de calcul de prime pure en assurance non-vie, nous avons exploré différentes approches de généralisation basées sur l'apprentissage non-supervisé. Enfin, la réglementation imposant également des critères en terme d'explication des modèles, nous concluons par une étude générale des méthodes qui permettent aujourd'hui de mieux comprendre les méthodes complexes telles que les réseaux de neurones