Algorithms on closure systems and their representations - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Algorithms on closure systems and their representations

Algorithmes pour les systèmes de fermeture et leurs représentations

Résumé

Knowledge Space Theory (KST) is a field of mathematical psychology which aims to assessand represent students knowledge. Its core structures, knowledge spaces and learning spacesare equivalent to well-known combinatorial objects: closure systems (or lattices) and convexgeometries respectively. Given a ground set, a closure system is a family of sets closed underintersection and containing the ground set. Its elements are called closed sets. Apart fromKST, closure systems are used in numerous fields of computer science such as Formal ConceptAnalysis, propositional logic, database theory, combinatorial optimization or argumentationtheory for instance. Because of their size, closure systems are often encoded with compactrepresentations such as implications or meet-irreducible elements. The former are rules A!Bdepicting a dependence relation within the closure system: a set including A must include B.The latter is a subfamily of closed sets from which the whole system can be recovered.In this thesis, we focus on two problems regarding closure systems and their representations.We begin with the problem of translating between the two representations of a closure system.This famous open problem generalizes the task of enumerating maximal independents sets of ahypergraph, known as hypergraph dualization. Our approach here is to give an algorithm whichhierarchically decomposes, if possible, a set of implications with partitioning operations called(acyclic) splits. We deduce a recursive characterization of the meet-irreducible elements of theassociated closure system. As a consequence, we obtain new types of closure systems (andconvex geometries) for which the translation can be done with an output-quasipolynomial timealgorithm relying on hypergraph dualization.Next, we study forbidden subsets and forbidden supersets in closure systems. First, weconsider families of forbidden supersets. A closed set not included in any forbidden set isupper-admissible. An inclusion-wise minimal upper-admissible closed set is upper-preferred.Using results on argumentation frameworks, we show that listing upper-admissible is intractablefrom a set of implications, even when forbidden supersets are co-pairs (complements of pairs).We hint a procedure to list the upper-admissible closed sets which can be applied in outputpolynomialtime from meet-irreducible elements, or from implications in particular classes ofclosure systems. The problem of enumerating upper-preferred closed sets generalizes the dualizationin lattices, being a hard task. Thus, we restrict our attention to forbidden co-pairs (complementsof pairs). The problem remains hard for implicational bases. For meet-irreducibleelements, we show that the problem can be solved with polynomial delay. Then, we move toforbidden subsets. We call lower-admissible a closed set which does not contain any forbiddensubset. A maximal lower-admissible closed set is lower-preferred. Connecting with thedualization in lattices, we show that enumerating lower-preferred closed sets with respect to aset of forbidden pairs is impossible in output-polynomial time unless P = NP, independentlyof the input representation. In fact, the problem becomes equivalent to the dualization in latticesin several generalizations of distributivity, thus contrasting with previous known resultson modular and median-semilattices. On the positive side, we use an algorithm parametrizedby the Carathéodory number to identify classes of convex geometries where the problem oflisting lower-preferred closed sets with respect to a set of forbidden pairs is tractable for everyrepresentation of the closure system. Applying the same procedure, we finally prove that thistask can be conducted in output-quasipolynomial time in atomistic modular lattices.We conclude the dissertation with possible directions for further research.
La théorie des espaces de connaissances est un domaine de la psychologie mathématique dont l’objectif est d’évaluer et représenter les connaissances des étudiant(e)s. Au coeur de cette théorie se trouvent les espaces de connaissances et les espaces d’apprentissage. Ces structures sont équivalentes à des objets combinatoires bien connus : les systèmes de fermeture (ou treillis) et les géométries convexes, respectivement. Un système de fermeture est une famille de sous-ensembles d’un ensemble de base V qui est fermée par intersection et qui contient V. Ses éléments sont appelés fermés. Outre la théorie des espaces de connaissance, les systèmes de fermeture se cachent dans de nombreux domaines de l’informatique parmi lesquels l’analyse formelle de concepts, la logique propositionnelle, la théorie des bases de données, l’optimisation combinatoire ou encore la théorie de l’argumentation. Cela étant, les systèmes de fermeture souffrent de leur taille. À ce titre, ils sont souvent codés avec des représentations compactes et implicites telles que des implications ou leurs éléments inf-irréductibles. Les implications sont des règles AB exprimant des dépendances au sein du système de fermeture : un fermé incluant A doit inclure B. Les inf-irréductibles sont, quant à eux, des fermés à partir desquels le système entier peut être reconstruit par intersections successives.Dans cette thèse, nous étudions deux problèmes concernant les systèmes de fermeture et ces deux représentations, à commencer par le problème de la traduction entre celles-ci. Cette question ouverte bien connue généralise le problème d’énumération des stables maximaux d’un hypergraphe, souvent appelé dualisation des hypergraphes. Notre approche ici est de décomposer hiérarchiquement, si possible, un ensemble d’implications par le prisme de partitions appelées splits (acycliques). Nous déduisons ainsi une caractérisation récursive des éléments inf-irréductibles du système de fermeture associé. En conséquence, nous obtenons de nouveaux types de systèmes de fermeture (et de géométries convexes) pour lesquels la traduction peut être effectuée en temps total quasi-polynomial au moyen d’un algorithme reposant sur la dualisation des hypergraphes.Ensuite, nous considérons les sous-ensembles et sur-ensembles interdits dans les systèmes de fermeture. En premier lieu, les sur-ensembles interdits. Un fermé qui n’est le sous-ensemble d’aucun sur-ensemble interdit est sur-admissible. Il est sur-préféré s’il est de surcroît minimal par inclusion. En utilisant des résultats sur l’argumentation, nous montrons que l’énumération des fermés sur-admissibles est impossible en temps total polynomial (à moins que P = NP) à partir d’un ensemble d’implications, même si les sur-ensembles interdits sont des co-paires (complémentaires de paires d’éléments). Nous donnons une procédure énumérant les fermés sur-admissibles en temps polynomial à partir des inf-irréductibles, ou à partir d’implications pour certains types de systèmes de fermeture. L’énumération des fermés sur-préférés généralise la dualisation dans les treillis, étant une tâche difficile. Ainsi, nous limitons notre attention aux co-paires interdites. Le problème reste difficile pour les bases d’implications. Pour les inf-irréductibles, nous montrons que le problème peut être résolu avec un délai polynomial. Ensuite,nous passons aux sous-ensembles interdits. Nous appelons sous-admissible un fermé qui ne contient aucun sous-ensemble interdit. Un fermé sous-admissible maximal par inclusion est sous-préféré. Via la dualisation dans les treillis, nous montrons que l’énumération des fermés sous-préférés est un problème difficile, indépendamment de la représentation choisie. En fait,le problème devient équivalent à la dualisation dans plusieurs classes de systèmes de fermeture généralisant la distributivité, contrastant ainsi avec certains résultats antérieurs sur les semi-treillis médians et modulaires. (...)
Fichier principal
Vignette du fichier
2021UCFAC078_VILMIN.pdf (2.51 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03565674 , version 1 (11-02-2022)
tel-03565674 , version 2 (10-05-2022)

Identifiants

  • HAL Id : tel-03565674 , version 2

Citer

Simon Vilmin. Algorithms on closure systems and their representations. Data Structures and Algorithms [cs.DS]. Université Clermont Auvergne, 2021. English. ⟨NNT : 2021UCFAC078⟩. ⟨tel-03565674v2⟩
180 Consultations
163 Téléchargements

Partager

Gmail Facebook X LinkedIn More