Thèse soutenue

Modèles contrefactuels pour un apprentissage machine explicable et juste : une approche par transport de masse

FR  |  
EN
Auteur / Autrice : Lucas De lara
Direction : Jean-Michel LoubèsLaurent Risser
Type : Thèse de doctorat
Discipline(s) : Mathématiques et Applications
Date : Soutenance le 19/06/2023
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de mathématiques de Toulouse (2007-....)
Jury : Président / Présidente : Christophe Giraud
Examinateurs / Examinatrices : Jean-Michel Loubès, Laurent Risser, Marianne Clausel, Arthur Charpentier, Emiliano Lorini
Rapporteurs / Rapporteuses : Marianne Clausel, Arthur Charpentier

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La propagation de règles de décision automatiques basées sur l'apprentissage machine a soulevé de graves préoccupations éthiques en raison de leur manque d'interprétabilité et de leur automatisation des biais discriminatoires humains. Ce problème a donné naissance à la recherche en l'intelligence artificielle digne de confiance, qui traite du développement d'algorithmes d'apprentissage automatique équitables et explicables. Cette thèse contribue à cette initiative en étudiant l'équité et l'explicabilité à travers le prisme du raisonnement contrefactuel : une modalité consacrée à des requêtes telles que "Si elle avait été un homme, lui aurait-on accordé le prêt ?". Le premier chapitre sert d'introduction aux méthodologies contrefactuelles dans l'apprentissage automatique et clarifie des idées reçues courantes. Le deuxième chapitre développe les fondements théoriques de la mise en œuvre de ce raisonnement à l'aide de méthodes de transport de masse telles que le transport optimal et l'appariemment difféomorphique. Contrairement aux méthodes standards, cette approche renvoie des énoncés contrefactuels qui sont à la fois implémentable d'un point de vue informatique et réalistes d'un point de vue sémantique, ce qui permet un déploiement plus large des méthodologies contrefactuelles pour l'équité et l'explicabilité. Les troisième et quatrième chapitres sont autonomes mais motivés par les aspects pratiques de ce point de vue par transport de masse du raisonnement contrefactuel : ils traitent de l'estimation statistique des modèles de transport. Le troisième chapitre présente un estimateur GAN d'applications de transport optimales Lipschitz accompagné de garanties statistiques uniques pour une telle approximation basée sur des réseaux de neurones. Le quatrième chapitre traite de l'appariemment difféomorphique, en fondant théoriquement et numériquement le transport de masse difféomorphique piloté par les divergences de Sinkhorn (des divergences de transport optimal entropique).