Extraction de motifs sous contraintes souples - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2014

Soft Constrains for Pattern Mining

Extraction de motifs sous contraintes souples

Résumé

The objective of this thesis is to introduce softness in pattern mining process in data mining. Using constraint programming, we were able to make four main contributions : (1) A general framework for implementing soft threshold constraints in a pattern mining prototype. (2) The introduction of softness in skypatterns (Pareto-optimal patterns with respect to a set of measures) and the proposal of a generic method for mining (hard) skypatterns as well as soft-skypatterns. (3) The introduction of the skypattern cube and two methods for its construction : one bottom-up, mainly based on derivation rules ; the other uses an approximation of all skypatterns the cube, the method being feasible thanks to the soft-skypatterns. (4) The introduction of the notion of optimal pattern for modeling many pattern extraction problems : skypatterns, top-k, closed patterns, . . . The declarative and genericity side of our approach opens the way for the denition and discovery of new sets of patterns. These contributions have been experimentally validated on real application domains such as the discovery of toxicophores for the rst two contributions and the discovery of mutagenic components for third one.
L'objectif de cette thèse est d'introduire de la souplesse dans le processus d'extraction de motifs en fouille de données. En utilisant la programmation par contraintes, nous avons pu apporter quatre principales contributions : (1) La proposition d'un cadre général permettant de mettre en ÷uvre les contraintes souples de seuil dans un extracteur de motifs. (2) L'introduction de la souplesse dans les skypatterns (motifs Pareto-optimaux par rapport à un ensemble de mesures) et la proposition d'une méthode générique permettant aussi bien l'extraction des skypatterns (durs) que des skypatterns souples. (3) L'introduction du cube de skypatterns et la proposition de deux méthodes permettant sa construction : l'une, ascendante, repose principalement sur des règles de dérivation ; l'autre, utilise une approximation de l'ensemble des skypatterns du cube, rendue possible grâce aux skypatterns souples. (4) L'introduction de la notion de motif optimal permettant de modéliser de nombreux problèmes d'extraction de motifs : skypatterns, top-k, motifs fermés, . . . La déclarativité et la généricité de notre approche nous semblent ouvrir la voie à la dénition et à la découverte de nouveaux ensembles de motifs. Ces contributions ont été validées expérimentalement sur des domaines applicatifs réels tels que la découverte de toxicophores pour les deux premières contributions et la découverte de composants mutagènes pour la troisième.
Fichier principal
Vignette du fichier
manuscrit.pdf (3.61 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01102267 , version 1 (12-01-2015)

Identifiants

  • HAL Id : tel-01102267 , version 1

Citer

Willy Ugarte Rojas. Extraction de motifs sous contraintes souples . Informatique [cs]. Université de Caen Basse-Normandie, 2014. Français. ⟨NNT : ⟩. ⟨tel-01102267⟩
277 Consultations
401 Téléchargements

Partager

Gmail Facebook X LinkedIn More