Constrained clustering by constraint programming

Khanh-Chuong Duong

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Classification non supervisée sous contrainte utilisateurs par la programmation par contraintes

FR |

EN

Auteur / Autrice :	Khanh-Chuong Duong
Direction :	Christel Vrain, Thi Bich Hanh Dao
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 10/12/2014
Etablissement(s) :	Orléans
Ecole(s) doctorale(s) :	École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire ; 2012-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique fondamentale d'Orléans (Orléans ; 1987-....)
Jury :	Président / Présidente : Lakhdar Saïs
	Examinateurs / Examinatrices : Christel Vrain, Thi Bich Hanh Dao, Lakhdar Saïs, Christine Solnon, Bruno Crémilleux, Luc De Raedt, Yves Deville
	Rapporteurs / Rapporteuses : Christine Solnon, Bruno Crémilleux, Luc De Raedt

Mots clés

FR |

EN

Mots clés contrôlés

Programmation par contraintes

Exploration de données

Mots clés libres

Classification non supervisée

Contraintes utilisateur

Programmation par contraintes

Clustering bi-critère

Résumé

FR |

EN

La classification non supervisée, souvent appelée par le terme anglais de clustering, est une tâche importante en Fouille de Données. Depuis une dizaine d'années, la classification non supervisée a été étendue pour intégrer des contraintes utilisateur permettant de modéliser des connaissances préalables dans le processus de clustering. Différents types de contraintes utilisateur peuvent être considérés, des contraintes pouvant porter soit sur les clusters, soit sur les instances. Dans cette thèse, nous étudions le cadre de la Programmation par Contraintes (PPC) pour modéliser les tâches de clustering sous contraintes utilisateur. Utiliser la PPC a deux avantages principaux : la déclarativité, qui permet d'intégrer aisément des contraintes utilisateur et la capacité de trouver une solution optimale qui satisfait toutes les contraintes (s'il en existe). Nous proposons deux modèles basés sur la PPC pour le clustering sous contraintes utilisateur. Les modèles sont généraux et flexibles, ils permettent d'intégrer des contraintes d'instances must-link et cannot-link et différents types de contraintes sur les clusters. Ils offrent également à l'utilisateur le choix entre différents critères d'optimisation. Afin d'améliorer l'efficacité, divers aspects sont étudiés. Les expérimentations sur des bases de données classiques et variées montrent qu'ils sont compétitifs par rapport aux approches exactes existantes. Nous montrons que nos modèles peuvent être intégrés dans une procédure plus générale et nous l'illustrons par la recherche de la frontière de Pareto dans un problème de clustering bi-critère sous contraintes utilisateur.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Classification non supervisée sous contrainte utilisateurs par la programmation par contraintes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Classification non supervisée sous contrainte utilisateurs par la programmation par contraintes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses