Thèse soutenue

Détection de criminalité financière par réseaux de neurones.

FR  |  
EN
Auteur / Autrice : Roxane Desrousseaux
Direction : Gilles BernardJean-Jacques Mariage
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 13/06/2022
Etablissement(s) : Paris 8
Ecole(s) doctorale(s) : École doctorale Cognition, langage, interaction (Saint-Denis, Seine-Saint-Denis)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire d’Intelligence Artificielle et Sémantique des Données
Jury : Président / Présidente : Kurosh Madani
Rapporteur / Rapporteuse : Younès Bennani, Nicoleta Rogovschi

Résumé

FR  |  
EN

En association avec HSBC, j’ai étudié dans cette thèse l'application de méthodes d'intelligence artificielle pour la détection de criminalité financière. L'objectif principal de cette thèse est d'automatiser l'identification d’activités suspectes en réduisant le besoin d'intervention humaine, ainsi qu'en limitant le nombre de fausses alertes, à l'aide d'algorithmes de réseaux de neurones. La collaboration avec HSBC a imposé d’accorder une attention particulière aux contraintes de l'industrie financière, comme la capacité de gérer la volumétrie des données avec des traitements rapides en temps réel mais également d'explicabilité du système. Comme solution, j’ai implémenté un cadre de détection basé sur une combinaison de deux modèles non supervisés utilisés en mode d'apprentissage en ligne. Les deux algorithmes sont des réseaux concurrentiels qui ont la propriété d'être facilement évolutifs, rapides et peu coûteux lorsque la dimensionnalité des données est importante. Ils ont également des propriétés d'explicabilité, sont particulièrement adaptés à la détection de valeurs aberrantes et offrent même des moyens de visualisation. Trois expérimentations ont été étudiées : la détection d’usurpation d’identité, le profilage de comportement de blanchiment d’argent et enfin la prédiction de toute forme d’activité criminelle. J’ai observé des temps de réponses de mon système de quelques millisecondes. En comparant les performances de ma solution à d'autres modèles de Machine Learning, mon système a obtenu les meilleurs résultats sur un jeu de test, avec 79% de transactions correctement prédites comme frauduleuses et un taux de fausses alertes largement inférieur à 1%.