Bibliosémantique : une technique linguistique et informatique par exploration contextuelle
Auteur / Autrice : | Marc Bertin |
Direction : | Jean-Pierre Desclès |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique - Linguistique |
Date : | Soutenance le 21/01/2011 |
Etablissement(s) : | Paris 4 |
Ecole(s) doctorale(s) : | École doctorale Concepts et langages (Paris ; 2000-....) |
Partenaire(s) de recherche : | Equipe de recherche : Sens, texte, informatique, histoire (Paris ; 2010-....) |
Jury : | Président / Présidente : Véronique Richard |
Examinateurs / Examinatrices : Jean-Pierre Desclès, Stefan Gradmann, Mohamed Hassoun, Frédérique Segond, Brigitte Gay | |
Rapporteur / Rapporteuse : Stefan Gradmann, Mohamed Hassoun |
Mots clés
Résumé
Nous avons défini la bibliosémantique comme appartenant aux domaines de l'informatique et de la linguistique. Les objectifs sont sensiblement les mêmes que ceux prônés par la scientométrie, l'infométrie ou la bibliométrie, à savoir classifier, organiser et évaluer. Le cœur de notre implémentation repose sur l’utilisation des corpora annotés sémantiquement par la plateforme EXCOM. La mise en œuvre de la méthode de l'exploration contextuelle a conduit à une implémentation informatique de la bibliosémantique qui repose donc sur une sémantique du discours à défaut d'être une application purement métrique dans le contexte de cette étude menée autour des références bibliographiques. C’est la reconnaissance des références indexées ou abrégées, au sein de corpus d’articles scientifiques, qui permet d’identifier les segments textuels candidats pour l’annotation. La thèse présente également des marqueurs discursifs organisés sous la forme d’une carte sémantique, constituant les ressources linguistiques nécessaires et permettant l’automatisation de l'ensemble des traitements sémantiques. Afin de proposer une interface de navigation conviviale et adaptée à notre problématique, le système a été développé sous forme de service web. De nouveaux produits documentaires comme une notice bibliographique augmentée ont été mis en œuvre afin de faciliter l’exploitation des annotations par l’utilisateur. Enfin, nous proposons une évaluation du système et nous explicitons le protocole utilisé. Ce travail se termine par la présentation d’un certain nombre de recommandations, notamment la mise en place d’une cellule de veille.