Extraction de motifs sous contraintes souples

par Willy Ugarte Rojas

Thèse de doctorat en Informatique et applications

Sous la direction de Patrice Boizumault et de Bruno Crémilleux.


  • Résumé

    Chaque cadre doit contenir un résumé de 1700 caractères maximum, espaces compris. En cas de dépassement, la coupure sera automatique. Le doctorant adresse son texte sous forme électronique selon les recommandations de la bibliothèque. L'objectif de cette thèse est d'introduire de la souplesse dans le processus d'extraction de motifs en fouille de données. En utilisant la programmation par contraintes, nous avons pu apporter quatre principales contributions : - La proposition d'un cadre général permettant de mettre en œuvre les contraintes souples de seuil dans un extracteur de motifs. - L'introduction de la souplesse dans les skypatterns (motifs Pareto-optimaux par rapport à un ensemble de mesures) et la proposition d'une méthode générique permettant aussi bien l'extraction des skypatterns (durs) que des skypatterns souples. - L'introduction du cube de skypatterns et la proposition de deux méthodes permettant sa construction~: l'une, ascendante, repose principalement sur des règles de dérivation; l'autre, utilise une approximation de l'ensemble des skypatterns du cube, rendue possible grâce aux skypatterns souples. - L'introduction de la notion de motif optimal permettant de modéliser de nombreux problèmes d'extraction de motifs : skypatterns, top-k, motifs fermés, …. La déclarativité et la généricité de notre approche nous semblent ouvrir la voie à la définition et à la découverte de nouveaux ensembles de motifs. Ces contributions ont été validées expérimentalement sur des domaines applicatifs réels tels que la découverte de toxicophores pour les deux premières contributions et la découverte de composants mutagènes pour la troisième.

  • Titre traduit

    Sosft contraints for pattern mining


  • Résumé

    The objective of this thesis is to introduce softness in pattern mining process in data mining. Using constraint programming, we were able to make four main contributions: - A general framework for implementing soft threshold constraints in a pattern mining prototype. - The introduction of softness in skypatterns (Pareto-optimal patterns with respect to a set of measures) and the proposal of a generic method for mining (hard) skypatterns as well as soft-skypatterns. - The introduction of the skypattern cube and two methods for its construction: one bottom-up, mainly based on derivation rules; the other uses an approximation of all skypatterns the cube, the method being feasible thanks to the soft-skypatterns. - The introduction of the notion of optimal pattern for modeling many pattern extraction problems: skypatterns, top-k, closed patterns,. . . The declarative and genericity side of our approach opens the way for the definition and discovery of new sets of patterns. These contributions have been experimentally validated on real application domains such as the discovery of toxicophores for the first two contributions and the discovery of mutagenic components for third one.

Autre version

Cette thèse a donné lieu à une publication en 2015 par [CCSD] [diffusion/distribution] à Villeurbanne

Extraction de motifs sous contraintes souples

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XIV-172 f.)
  • Annexes : Bibliogr. 148 ref. Index

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Caen Normandie. Bibliothèque Rosalind Franklin (Sciences-STAPS).
  • Non disponible pour le PEB
  • Cote : TCAS-2014-40
  • Bibliothèque : Université de Caen Normandie. Bibliothèque Rosalind Franklin (Sciences-STAPS).
  • Disponible pour le PEB
  • Cote : TCAS-2014-40bis
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.