Conception et Implémentation d'un Environnement d'Ontologie pour des Bibliothèques Formelles
Auteur / Autrice : | Nicolas Méric |
Direction : | Burkhart Wolff, Idir Aït-Sadoune |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 12/07/2024 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Méthodes formelles (Gif-sur-Yvette, Essonne ; 2021-....) |
Référent : Université Paris-Saclay. Faculté des sciences d’Orsay (Essonne ; 2020-....) | |
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….) | |
Jury : | Président / Présidente : Catherine Dubois |
Examinateurs / Examinatrices : Yamine Aït-Ameur, Dominique Méry, Frédéric Boulanger, Régine Laleau, Laure Petrucci | |
Rapporteurs / Rapporteuses : Yamine Aït-Ameur, Dominique Méry |
Mots clés
Résumé
Les ontologies de documents, c’est-à-dire une forme traitable par la machine de la structure des documents et du discours des documents, jouent un rôle crucial dans la structuration du lien entre des notions sémantiques et des documents contenant du texte informel. Dans de nombreuses disciplines scientifiques comme la médecine ou la biologie, les ontologies permettent l’organisation des articles de recherche et leur accès automatisé. Les champs des mathématiques et de l’ingénierie représentent un défi particulier avec des documents qui contiennent à la fois des éléments textuels formels et informels avec une structure complexe de liens mutuels et de dépendances de divers types. Les textes peuvent contenir des formules (qui devraient au moins être correctement typées et si possible sémantiquement cohérentes avec les définitions formelles) et des définitions formelles fondées sur des conventions de nommage qui devraient refléter les explications informelles. Un accès approfondi aux parties formelles de ce type de documents implique un cadre capable de prendre en compte des langages logiques typés, ce qui nécessite d’aller beaucoup plus loin que les langages ontologiques existants comme, par exemple, OWL [1, 2]. Le point de départ de ce travail est le langage ontologique ODL implanté dans Isabelle/DOF [3, 4, 5]. Profondément intégré dans l’assistant de preuve Isabelle/HOL et son interface PIDE, il permet à la fois le développement d’ontologies typées et de documents contenant des définitions, de la documentation et des preuves formelles pour des textes mathématiques et d’ingénierie formelle.Les ontologies génèrent des théories de métainformations et les utilisent pour la validation de contraintes à respecter lors de l’édition des documents. L’implantation originelle prenait en charge des liens vers les termes dans des définitions et des preuves, mais pas les liens entre les termes, ni l’ajout de méta-informations structurées à l’intérieur et entre des formules ou des preuves. Le mécanisme de validation des métainformations était réduit à des solutions artisanales. En outre, des entités formelles comme les définitions ou les lemmes ne pouvaient pas être référencées en tant qu’entités ontologiques. Ces fonctionnalités sont néanmoins essentielles à un certain nombre d’applications pour l’échange d’informations (semi-)formelles entre des prouveurs interactifs et automatisés d’une part, et pour des techniques de recherches sémantiquesavancées axées sur la connaissance dans ces documents d’autre part.Cette thèse surmonte ces limitations : Isabelle/DOF est étendu par un mécanisme de description et d’évaluation des méta-informations à l’intérieur du niveau des termes et des objets de preuve. Il est donc conçu pour fournir une intégration « plus profonde » dans des textes de bibliothèques mathématiques formelles, pour lesquelles les entités formelles peuvent être abstraites et devenir des éléments de document. Les entités formelles représentant des termes, des définitions ou des théorèmes peuvent être référencées et utilisées comme des objets ontologiques de première classe. La nouvelle prise en charge du polymorphisme paramétré par des classes de type permet de généraliser les concepts ontologiques. Ces nouvelles fonctionnalités d’Isabelle/DOF peuvent exprimer non seulement des liens entre du texte informel et des concepts ontologiquesformels mais aussi entre des entités formelles ou informelles en tant qu’éléments de documents, permettant ainsi d’affiner le lien entre des éléments de documents et la connaissance dans des textes mathématiques et d’ingénierie. Un mécanisme de réification dans Isabelle/DOF permet d’attacher des méta-données ontologiques à des objets de preuve pour ajouter de la connaissance sur la structure de scripts de preuves et les tactiques de preuve associées pour prouver un théorème. Cela pourrait être approprié pour des techniques d’importation/exportation de preuves entre assistants de preuve [6, 7].