Thèse soutenue

Interpretable Machine Learning Models via Maximum Boolean Satisfiability

FR  |  
EN
Auteur / Autrice : Hao Hu
Direction : Marie-José HuguetMohamed Siala
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 14/12/2022
Etablissement(s) : Toulouse, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications
Partenaire(s) de recherche : Laboratoire : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes - Laboratoire d'analyse et d'architecture des systèmes / LAAS
Jury : Président / Présidente : Hélène Fargier
Examinateurs / Examinatrices : Djamal Habet
Rapporteurs / Rapporteuses : Chumin Li, Frédéric Koriche

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les modèles d’apprentissage interprétables reçoivent un intérêt croissant en raisonde l’augmentation des préoccupations pour comprendre le raisonnement menantaux décisions cruciales prises par les systèmes modernes d’intelligence artificielle.En raison de leur structure, en particulier pour des petites tailles, ces modèlesinterprétables sont intrinsèquement compréhensibles pour les humains. Par rapportaux méthodes heuristiques classiques pour apprendre ces modèles, les méthodesexactes récentes offrent des modèles plus compacts ou atteingnent une meilleurequalité de prédiction. Dans cette thèse, nous proposons deux nouvelles méthodesexactes basées sur la Satisfiabilité Booléenne Maximale (MaxSAT) pour apprendredes modèles d’apprentissage interprétables optimaux.Notre contribution commence par une méthode exacte originale basée sur MaxSATpour apprendre des arbres de décision optimaux. Cette méthode optimise la précision empirique pour éviter le surapprentissage et prend également en compte des contraintes pour restreindre la profondeur de l’arbre. De plus, nous intégrons cette méthode basée sur MaxSAT à la méthode AdaBoost, qui est une méthode standard de Boosting pour améliorer les performances de généralisation. Les résultats expérimentaux montrent une qualité de prédiction compétitive de cette méthode basée sur MaxSAT par rapport à des méthodes heuristiques et exactes de l’état de l’art. En plus, des améliorations des performances de prédiction sont observées après intégration dans AdaBoost.Notre deuxième contribution est une méthode exacte originalebasée sur MaxSAT pour optimiser les diagrammes de décision binaire. Nous introduisons tout d’abord un encodage de Satisfiabilité Booléenne (SAT) pour modéliser des diagrammes de décision binaire de profondeur limitée avec une parfaite précision. Puis, nous présentons comment adapter le modèle en Satisfiabilité Booléenne Maximale. Finalement, nous présentons un pré-traitement pour la sélection de certaines caractéristiques importantes afin d’augmenter le passage à l’échelle de notre méthode MaxSAT pour optimiser les diagrammes de décision binaire. Les résultats expérimentaux montrent des avancées de notre méthode MaxSAT sur la qualité de prédiction, par rapport aux méthodes heuristiques. Nous observons également une réduction importante sur la taille d’encodage et la taille du modèle dans les comparaisons entre notre approche et une méthode exacte de l’état de l’art, sans perdre en performance de prédiction. De plus, une grande réduction sur la taille d’encodage est mise en évidence après application du pré-traitement, ce qui renforce le passage à l’échelle.