2017-10-20T11:53:23Z
2018-04-28T04:27:16Z
Exploring sequential data with relational concept analysis
2017
2017-10-13
Electronic Thesis or
Dissertation
text
Text
electronic
De nombreuses méthodes d’extraction de motifs séquentiels ont été proposées pour découvrir des motifs utiles qui décrivent les données analysées. Certaines de ces travaux se sont concentrés sur l’énumération efficace de motifs partiellement ordonnés fermés (cpo-motifs), ce qui rend leur évaluation difficile pour les experts, car leur nombre peut être important. Par suite, nous proposons une approche nouvelle, qui consiste à extraire directement des cpo-motifs multi-niveaux qui sont organisés dans une hiérarchie. Nous proposons une méthode originale dans la cadre de l’Analyse Relationnelle de Concepts (ARC), appelée RCA-SEQ, qui exploite la structure et les propriétés des treillis issus de l’ARC. RCA-SEQ comporte cinq étapes : le prétraitement des données ; l'exploration par l’ARC des données ; l'extraction automatisée d'une hiérarchie de cpo-motifs multi-niveaux par navigation des treillis issus de l’ARC ; la sélection de cpo-motifs pertinents ; l'évaluation des motifs par les experts.
Many sequential pattern mining methods have been proposed to discover useful patterns that describe the analysed sequential data. Several of these works have focused on efficiently enumerating all closed partially-ordered patterns (cpo-patterns), that makes their evaluation a laboured task for experts since their number can be large. To address this issue, we propose a new approach, that is to directly extract multilevel cpo-patterns implicitly organised into a hierarchy. To this end, we devise an original method within the Relational Concept Analysis (RCA) framework, referred to as RCA-SEQ, that exploits the structure and properties of the lattices from the RCA output. RCA-SEQ spans five steps: the preprocessing of the raw data; the RCA-based exploration of the preprocessed data; the automatic extraction of a hierarchy of multilevel cpo-patterns by navigating the lattices from the RCA output; the selection of relevant multilevel cpo-patterns; the pattern evaluation done by experts.
Écologie des eaux -- Bases de données
Treillis, Théorie des
Exploration de données
Intelligence artificielle
Analyse formelle de concepts
Ontologies (informatique)
Données séquentielles
Analyse Relationnelle de Concepts
Motifs partialement ordonnés fermés
Motifs multi-niveaux
Hiérarchie de motifs
Mesures d’intérêt
Sequential data
Relational Concept Analysis
Closed partially-ordered patterns
Multilevel patterns
Hierarchy of patterns
Measures of interest
005.7
006.33
Nica, Cristina
Le Ber, Florence
Strasbourg
École doctorale Mathématiques, sciences de l'information et de l'ingénieur (Strasbourg ; 1997-....)
Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (Strasbourg)
http://www.theses.fr/2017STRAD032/document