Thèse soutenue

Extraction de motifs sous contraintes souples
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Willy Ugarte Rojas
Direction : Patrice BoizumaultBruno Crémilleux
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance en 2014
Etablissement(s) : Caen
Ecole(s) doctorale(s) : École doctorale structures, informations, matière et matériaux (Caen ; 1992-2016)
Partenaire(s) de recherche : Laboratoire : Groupe de recherche en informatique, image, automatique et instrumentation de Caen (1995-....)
Jury : Président / Présidente : Christel Vrain
Examinateurs / Examinatrices : Patrice Boizumault, Bruno Crémilleux, Christel Vrain, Jean-François Boulicaut, Lakhdar Saïs, Chedy Raissi, Samir Loudni
Rapporteurs / Rapporteuses : Jean-François Boulicaut, Lakhdar Saïs

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Chaque cadre doit contenir un résumé de 1700 caractères maximum, espaces compris. En cas de dépassement, la coupure sera automatique. Le doctorant adresse son texte sous forme électronique selon les recommandations de la bibliothèque. L'objectif de cette thèse est d'introduire de la souplesse dans le processus d'extraction de motifs en fouille de données. En utilisant la programmation par contraintes, nous avons pu apporter quatre principales contributions : - La proposition d'un cadre général permettant de mettre en œuvre les contraintes souples de seuil dans un extracteur de motifs. - L'introduction de la souplesse dans les skypatterns (motifs Pareto-optimaux par rapport à un ensemble de mesures) et la proposition d'une méthode générique permettant aussi bien l'extraction des skypatterns (durs) que des skypatterns souples. - L'introduction du cube de skypatterns et la proposition de deux méthodes permettant sa construction~: l'une, ascendante, repose principalement sur des règles de dérivation; l'autre, utilise une approximation de l'ensemble des skypatterns du cube, rendue possible grâce aux skypatterns souples. - L'introduction de la notion de motif optimal permettant de modéliser de nombreux problèmes d'extraction de motifs : skypatterns, top-k, motifs fermés, …. La déclarativité et la généricité de notre approche nous semblent ouvrir la voie à la définition et à la découverte de nouveaux ensembles de motifs. Ces contributions ont été validées expérimentalement sur des domaines applicatifs réels tels que la découverte de toxicophores pour les deux premières contributions et la découverte de composants mutagènes pour la troisième.