Auteur / Autrice : | Willy Ugarte Rojas |
Direction : | Patrice Boizumault, Bruno Crémilleux |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et applications |
Date : | Soutenance en 2014 |
Etablissement(s) : | Caen |
Ecole(s) doctorale(s) : | École doctorale structures, informations, matière et matériaux (Caen ; 1992-2016) |
Partenaire(s) de recherche : | Laboratoire : Groupe de recherche en informatique, image, automatique et instrumentation de Caen (1995-....) |
Jury : | Président / Présidente : Christel Vrain |
Examinateurs / Examinatrices : Patrice Boizumault, Bruno Crémilleux, Christel Vrain, Jean-François Boulicaut, Lakhdar Saïs, Chedy Raissi, Samir Loudni | |
Rapporteurs / Rapporteuses : Jean-François Boulicaut, Lakhdar Saïs |
Mots clés
Mots clés contrôlés
Résumé
Chaque cadre doit contenir un résumé de 1700 caractères maximum, espaces compris. En cas de dépassement, la coupure sera automatique. Le doctorant adresse son texte sous forme électronique selon les recommandations de la bibliothèque. L'objectif de cette thèse est d'introduire de la souplesse dans le processus d'extraction de motifs en fouille de données. En utilisant la programmation par contraintes, nous avons pu apporter quatre principales contributions : - La proposition d'un cadre général permettant de mettre en œuvre les contraintes souples de seuil dans un extracteur de motifs. - L'introduction de la souplesse dans les skypatterns (motifs Pareto-optimaux par rapport à un ensemble de mesures) et la proposition d'une méthode générique permettant aussi bien l'extraction des skypatterns (durs) que des skypatterns souples. - L'introduction du cube de skypatterns et la proposition de deux méthodes permettant sa construction~: l'une, ascendante, repose principalement sur des règles de dérivation; l'autre, utilise une approximation de l'ensemble des skypatterns du cube, rendue possible grâce aux skypatterns souples. - L'introduction de la notion de motif optimal permettant de modéliser de nombreux problèmes d'extraction de motifs : skypatterns, top-k, motifs fermés, …. La déclarativité et la généricité de notre approche nous semblent ouvrir la voie à la définition et à la découverte de nouveaux ensembles de motifs. Ces contributions ont été validées expérimentalement sur des domaines applicatifs réels tels que la découverte de toxicophores pour les deux premières contributions et la découverte de composants mutagènes pour la troisième.