Apprentissage neuronal et validation de modèles hiérarchiques d’aide à la décision multicritère présentant de l'interaction entre les critères
Auteur / Autrice : | Roman Bresson |
Direction : | Johanne Cohen, Christophe Labreuche |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 02/02/2022 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Saclay, Ile-de-France) |
Référent : Faculté des sciences d'Orsay | |
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….) | |
Jury : | Président / Présidente : Patrice Perny |
Examinateurs / Examinatrices : Andrea Passerini, Michèle Sebag, Eyke Hüllermeier, Hendrik Blockeel, Krzysztof Dembczynski | |
Rapporteur / Rapporteuse : Patrice Perny, Andrea Passerini |
Mots clés
Mots clés contrôlés
Résumé
L’aide à la décision multicritères (ADMC) est un domaine qui vise à aider des décideurs experts (DE) pour des problèmes tels que la sélection, le classement ou la classification d’alternatives définies par plusieurs attributs qui peuvent intéragir. Ces modèles ne sont pas ceux qui prennent pas la décision, mais ils apportent une assistance au DE lors du processus. Il est donc crucial que le modèle offre au DE des moyens d’interpréter ses résultats. Ceci est en particulier vrai dans des contextes critiques où les erreurs peuvent avoir des conséquences désastreuses. Il est par conséquent indispensable que les modèles d’ADMC soient intelligibles, interprétables et que leur comportement soit fortement contraint par des connaissances provenant d’une expertise dans le domaine. De tels modèles sont généralement construits par une interaction (questions/réponses) avec un DE, par le biais de méthodes issues de la recherche opérationnelle. D’autre part, l’apprentissage automatique (ML) fonde son approche sur l’apprentissage du modèle optimal à partir de données d’ajustement. Ce domaine se concentre généralement sur les performances du modèle, en adaptant les paramètres de modèles complexes (dits boîtes noires) pour obtenir une erreur statistiquement faible sur de nouveaux exemples. Bien que cette approche soit adaptée à de nombreux contextes, l’utilisation de modèles boîtes noires est inconcevable dans les cas usuels d’ADMC, car ils ne sont ni interprétable, ni facilement contraignables. Cette thèse fait le pont entre ces deux domaines. Nous nous concentrons sur une certaine classe de modèles d’ADMC, appelés intégrales de Choquet hiérarchiques utilitaires (ICHU). Notre première contribution, qui est théorique, est de montrer l’identifiabilité (ou l’unicité de la paramétrisation) des ICHUs. Ce résultat motive notre seconde contribution : le framework NeurHCI, une architecture de modules de réseaux de neurones qui peuvent apprendre les paramètres d’un ICHU. En particulier, tous les modèles NeurHCI sont garantis comme étant formellement valides, répondant aux contraintes qui conviennent à de tels modèles (monotonie, normalisation), et restent interprétables. Nous montrons empiriquement que les modèles Neur-HCI sont performants sur des ensembles de données artificielles et réelles, et qu’ils présentent une stabilité remarquable, ce qui en fait des outils pertinents pour alléger l’effort d’élicitation de modèles lorsque les données sont facilement disponibles, et permet leur utilisation comme outils d’analyse appropriés pour identifier certains phénomènes sous-jacents dans les données.