Bibliosémantique : une technique linguistique et informatique par exploration contextuelle

par Marc Bertin

Thèse de doctorat en Informatique - Linguistique

Sous la direction de Jean-Pierre Desclès.

Soutenue le 21-01-2011

à Paris 4 , dans le cadre de École doctorale Concepts et langages (Paris) , en partenariat avec Sens, texte, informatique, histoire (Paris) (équipe de recherche) .

Le président du jury était Véronique Richard.

Le jury était composé de Jean-Pierre Desclès, Stefan Gradmann, Mohamed Hassoun, Frédérique Segond, Brigitte Gay.

Les rapporteurs étaient Stefan Gradmann, Mohamed Hassoun.


  • Résumé

    Nous avons défini la bibliosémantique comme appartenant aux domaines de l'informatique et de la linguistique. Les objectifs sont sensiblement les mêmes que ceux prônés par la scientométrie, l'infométrie ou la bibliométrie, à savoir classifier, organiser et évaluer. Le cœur de notre implémentation repose sur l’utilisation des corpora annotés sémantiquement par la plateforme EXCOM. La mise en œuvre de la méthode de l'exploration contextuelle a conduit à une implémentation informatique de la bibliosémantique qui repose donc sur une sémantique du discours à défaut d'être une application purement métrique dans le contexte de cette étude menée autour des références bibliographiques. C’est la reconnaissance des références indexées ou abrégées, au sein de corpus d’articles scientifiques, qui permet d’identifier les segments textuels candidats pour l’annotation. La thèse présente également des marqueurs discursifs organisés sous la forme d’une carte sémantique, constituant les ressources linguistiques nécessaires et permettant l’automatisation de l'ensemble des traitements sémantiques. Afin de proposer une interface de navigation conviviale et adaptée à notre problématique, le système a été développé sous forme de service web. De nouveaux produits documentaires comme une notice bibliographique augmentée ont été mis en œuvre afin de faciliter l’exploitation des annotations par l’utilisateur. Enfin, nous proposons une évaluation du système et nous explicitons le protocole utilisé. Ce travail se termine par la présentation d’un certain nombre de recommandations, notamment la mise en place d’une cellule de veille.

  • Titre traduit

    Bibliosémantic : a linguistic and computational method by contextual exploration


  • Résumé

    We have defined Bibliosemantics as belonging to both fields of Computing and Linguistics. Its objectives are essentially the same as those advocated by the Scientometrics, Informetrics and Bibliometrics, i. e. classify, organize, evaluate. The core of our implementation is based on the use of semantically annotated corpora by EXCOM platform. The application of the Contextual Exploration method has led to a computer implementation of Bibliosemantics based on discourse semantics, as it is not a purely metric application in the context of this study about bibliographic references. The identification of indexed or abbreviated references in a corpus of scientific papers allows to establish the textual segments candidates for annotation. This thesis also presents the discourse markers, organised in a semantic map, which constitute the necessary linguistic resources making possible the automatic semantic processing. The system has been developed as a web service, with the aim to provide a navigation interface which is user-friendly and adapted to our problem. New documentary products such as a enriched bibliographic records have been implemented in order to facilitate the exploitation of annotations by the user. Finally, we propose an evaluation of the system and we explain the used protocol. This work culminates with the presentation of a number of recommendations such as setting up a monitoring unit.


Le texte intégral de cette thèse n'est pas accessible en ligne.
Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université de Paris-Sorbonne. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.