Détection de criminalité financière par réseaux de neurones.
Auteur / Autrice : | Roxane Desrousseaux |
Direction : | Gilles Bernard, Jean-Jacques Mariage |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 13/06/2022 |
Etablissement(s) : | Paris 8 |
Ecole(s) doctorale(s) : | École doctorale Cognition, langage, interaction (Saint-Denis, Seine-Saint-Denis) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire d’Intelligence Artificielle et Sémantique des Données |
Jury : | Président / Présidente : Kurosh Madani |
Rapporteur / Rapporteuse : Younès Bennani, Nicoleta Rogovschi |
Mots clés
Mots clés contrôlés
Résumé
En association avec HSBC, j’ai étudié dans cette thèse l'application de méthodes d'intelligence artificielle pour la détection de criminalité financière. L'objectif principal de cette thèse est d'automatiser l'identification d’activités suspectes en réduisant le besoin d'intervention humaine, ainsi qu'en limitant le nombre de fausses alertes, à l'aide d'algorithmes de réseaux de neurones. La collaboration avec HSBC a imposé d’accorder une attention particulière aux contraintes de l'industrie financière, comme la capacité de gérer la volumétrie des données avec des traitements rapides en temps réel mais également d'explicabilité du système. Comme solution, j’ai implémenté un cadre de détection basé sur une combinaison de deux modèles non supervisés utilisés en mode d'apprentissage en ligne. Les deux algorithmes sont des réseaux concurrentiels qui ont la propriété d'être facilement évolutifs, rapides et peu coûteux lorsque la dimensionnalité des données est importante. Ils ont également des propriétés d'explicabilité, sont particulièrement adaptés à la détection de valeurs aberrantes et offrent même des moyens de visualisation. Trois expérimentations ont été étudiées : la détection d’usurpation d’identité, le profilage de comportement de blanchiment d’argent et enfin la prédiction de toute forme d’activité criminelle. J’ai observé des temps de réponses de mon système de quelques millisecondes. En comparant les performances de ma solution à d'autres modèles de Machine Learning, mon système a obtenu les meilleurs résultats sur un jeu de test, avec 79% de transactions correctement prédites comme frauduleuses et un taux de fausses alertes largement inférieur à 1%.