Thèse soutenue

Apprentissage de préférences à l’aide de modèles multi-critères

FR  |  
EN
Auteur / Autrice : Olivier Sobrie
Direction : Vincent MousseauMarc PirlotPhilippe Fortemps
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 21/06/2016
Etablissement(s) : Université Paris-Saclay (ComUE) en cotutelle avec Université de Mons
Ecole(s) doctorale(s) : École doctorale Interfaces : matériaux, systèmes, usages (Palaiseau, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : CentraleSupélec (2015-....)
Laboratoire : Laboratoire génie industriel (Gif-sur-Yvette, Essonne)
Jury : Président / Présidente : Saïd Mahmoudi
Examinateurs / Examinatrices : Vincent Mousseau, Marc Pirlot, Philippe Fortemps, Nicolas Gillis, Wassila Ouerdane
Rapporteurs / Rapporteuses : Yves De Smet, Christophe Labreuche

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L’aide multicritère à la décision (AMCD) vise à faciliter et améliorer la qualité du processus de prise de décision. Les méthodes d’AMCD permettent de traiter les problèmes de choix, rangement et classification. Ces méthodes impliquent généralement la construction d’un modèle. Déterminer les valeurs des paramètres de ces modèles n’est pas aisé. Les méthodes d’apprentissage indirectes permettent de simplifier cette tâche en apprenant les paramètres du modèle de décision à partir de jugements émis par un décideur tels que “l’alternative a est préférée à l’alternative b” ou “l’alternative a doit être classifiée dans la meilleure catégorie”. Les informations données par le décideur sont généralement parcimonieuses. Le modèle d’AMCD est appris au cours d’un processus interactif entre le décideur et l’analyste. L’analyste aide le décideur à formuler et revoir ses jugements si nécessaire. Le processus s’arrête une fois qu’un modèle satisfaisant les préférences du décideur a été trouvé. Le “preference learning” (PL) est un sous domaine du “machine learning” qui s’intéresse à l’apprentissage des préférences. Les algorithmes de ce domaine sont capables de traiter de grands jeux de données et sont validés au moyen de jeux de données artificiels et réels. Les jeux de données traités en PL sont généralement collectés de différentes sources et sont entachés de bruit.Contrairement à l’AMCD, il existe peu ou pas d’interaction avec l’utilisateur en PL. Le jeu de données fourni en entrée à l’algorithme est considéré comme un échantillon éventuellement bruité d’une “réalité” ou “vérité de terrain”. Les algorithmes utilisés dans ce domaine ont des propriétés statistiques fortes leur permettant de s’affranchir du bruit dans ces jeux de données. Dans cette thèse, nous développons des algorithmes d’apprentissage permettant d’apprendre lesparamètres de modèles d’AMCD. Plus précisément, nous développons une métaheuristique afin d’apprendre les paramètres d’un modèle appelé MR-Sort (“majority rule sorting”). Cette métaheuristique est testée sur des jeux de donnéesartificiels et réels utilisés dans le domaine du PL. Nous utilisons cet algorithme afin de traiter un problème concret dans le domaine médical. Ensuite nous modifions la métaheuristique afin d’apprendre les paramètres d’un modèle plus expressif appelé NCS (“non-compensatory sorting”). Finalement, nous développons un nouveau type de règle de veto pour les modèles MR-Sort et NCS qui permet de prendre les coalitions de critères en compte. La dernière partie de la thèse introduit les méthodes d’optimisation semi-définie positive (SDP) dans le contexte de l’aide multicritère à la décision. Précisément, nous utilisons l’optimisation SDP afin d’apprendre les paramètres d’un modèle de fonction de valeur additive.