Thèse soutenue

Clustering et intégration de connaissances
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Nguyen Viet Dung Nghiem
Direction : Christel VrainThi Bich Hanh Dao
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 15/12/2021
Etablissement(s) : Orléans
Ecole(s) doctorale(s) : École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique fondamentale d'Orléans (Orléans ; 1987-....)
Jury : Président / Présidente : Antoine Cornuéjols
Examinateurs / Examinatrices : Pierre Marquis
Rapporteurs / Rapporteuses : Tias Guns, Dino Ienco

Résumé

FR  |  
EN

Le clustering sous contraintes (une généralisation du clustering semi-supervisé) vise à exploiter lesconnaissances des experts lors de la tâche de clustering. La connaissance s'exprime souvent par unensemble de contraintes et peut prendre des formes diverses. Dans cette thèse, nous développons deuxmécanismes pour intégrer des contraintes dans la tâche de clustering. Dans la première partie, nousproposons une méthode déclarative post-traitement pour adapter la sortie d'un algorithme de clustering poursatisfaire les contraintes. L'originalité est de considérer une matrice d'allocation qui donne les scoresd'attribution des points à chaque cluster et de trouver la meilleure partition satisfaisant toutes les contraintes.Dans la deuxième partie, nous proposons un cadre unifié pour intégrer les contraintes générales dans unmodèle de clustering avec l'apprentissage profond. La généricité se représente en formalisant descontraintes en logique et en considérant leurs modèles. Les résultats expérimentaux sur des jeux dedonnées connus montrent que notre approche est compétitive avec d'autres méthodes spécifiques auxcontraintes tout en étant générale. De plus, nous avons défini et formulé de nouveaux types de contraintesen clustering : la contrainte de couverture de cluster limitant le nombre de clusters auxquels un groupe depoints peut appartenir, et la contrainte d'équité combinée prenant en compte à la fois l'équité de groupe etl'équité individuelle.