Thèse soutenue

Modèles prédictifs & raisonnement avec les explications

FR  |  
EN
Auteur / Autrice : Ryma Boumazouza
Direction : Bertrand MazureKarim Tabia
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance le 08/12/2022
Etablissement(s) : Artois
Ecole(s) doctorale(s) : École doctorale Sciences, technologie et santé (Amiens)
Partenaire(s) de recherche : Laboratoire : Centre de recherche en informatique (Lens, Pas-de-Calais ; 2008-....)
Jury : Président / Présidente : Sylvain Lagrue
Examinateurs / Examinatrices : Bertrand Mazure, Karim Tabia, Marie-Jeanne Lesot, Fahima Cheikh, Christine Solnon
Rapporteurs / Rapporteuses : Sylvain Lagrue, Marie-Jeanne Lesot

Résumé

FR  |  
EN

Cette thèse étudie une méthode d'explicabilité qui allie à la fois le caractère ''agnostique'' des méthodes numériques et qui propose des explications plus ''rigoureuses'' qui caractérisent les explications symboliques. Le but étant d'expliquer les prédictions des techniques de classification mono-étiquette et multi-étiquettes. Plusieurs contributions sont apportées dans cette thèse. Premièrement, nous avons travaillé sur le cas mono-étiquette. Nous avons proposé une approche qui va de l'encodage en représentation symbolique du modèle dont on souhaite expliquer les prédictions à la génération d'explication basée sur un oracle SAT. L'idée est de prendre un classificateur, avec une instance, et de produire une formule propositionnelle que nous utiliserons pour générer nos explications. L'inconsistance de cette formule permet d'expliquer les prédictions négatives.Nous considérons les deux cas où nous pouvons avoir la représentation logique du modèle dans son ensemble ou une approximation basée sur un modèle de substitution.Nous nous intéressons à deux types complémentaires d'explications symboliques : les raisons suffisantes qui correspondent à un sous-ensemble minimal de l'entrée conduisant à une prédiction spécifique et les contrefactuelles qui correspondent à un sous-ensemble de l'entrée permettant de connaître les modifications minimales à apporter pour obtenir une prédiction différente.Deuxièmement, nous avons proposé des propriétés à considérer afin de prioriser et sélectionner les explications en évaluant leur pertinence ainsi que celle des variables les composants. Par la suite, nous nous sommes intéressés à l'explication des prédictions multi-étiquettes. Nous avons proposé des explications multi-étiquettes à différents niveaux de granularité et étudié la combinaison d'explications mono-étiquette ainsi que les relations structurelles entre classes comme moyen de les générer. Enfin, nous nous sommes intéressés aux scores d'importance au niveau des caractéristiques pour déterminer dans quelle mesure chacune contribue à la sortie d'un modèle multi-étiquettes. Cette contribution examine deux possibilités différentes d'utiliser des méthodes existantes pour le single-label comme oracles ou d'utiliser des attributions de caractéristiques obtenues à partir d'explications symboliques. Afin d'évaluer la qualité des attributions de caractéristiques, nous étendons les propriétés de sensibilité, de stabilité des données au cas multi-étiquettes en plus d'une nouvelle propriété spécifique à la classification multi-étiquettes que nous appelons corrélation label-explication.