Auteur / Autrice : | Nguyen Viet Dung Nghiem |
Direction : | Christel Vrain, Thi Bich Hanh Dao |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 15/12/2021 |
Etablissement(s) : | Orléans |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique fondamentale d'Orléans (Orléans ; 1987-....) |
Jury : | Président / Présidente : Antoine Cornuéjols |
Examinateurs / Examinatrices : Pierre Marquis | |
Rapporteurs / Rapporteuses : Tias Guns, Dino Ienco |
Mots clés
Résumé
Le clustering sous contraintes (une généralisation du clustering semi-supervisé) vise à exploiter lesconnaissances des experts lors de la tâche de clustering. La connaissance s'exprime souvent par unensemble de contraintes et peut prendre des formes diverses. Dans cette thèse, nous développons deuxmécanismes pour intégrer des contraintes dans la tâche de clustering. Dans la première partie, nousproposons une méthode déclarative post-traitement pour adapter la sortie d'un algorithme de clustering poursatisfaire les contraintes. L'originalité est de considérer une matrice d'allocation qui donne les scoresd'attribution des points à chaque cluster et de trouver la meilleure partition satisfaisant toutes les contraintes.Dans la deuxième partie, nous proposons un cadre unifié pour intégrer les contraintes générales dans unmodèle de clustering avec l'apprentissage profond. La généricité se représente en formalisant descontraintes en logique et en considérant leurs modèles. Les résultats expérimentaux sur des jeux dedonnées connus montrent que notre approche est compétitive avec d'autres méthodes spécifiques auxcontraintes tout en étant générale. De plus, nous avons défini et formulé de nouveaux types de contraintesen clustering : la contrainte de couverture de cluster limitant le nombre de clusters auxquels un groupe depoints peut appartenir, et la contrainte d'équité combinée prenant en compte à la fois l'équité de groupe etl'équité individuelle.