TEF 2.0

Usages de TEF

TEF a pour objectif de favoriser la diffusion et la réutilisation de métadonnées riches, de diverses origines et normalisées. Cette diffusion peut prendre deux formes différentes : un échange de métadonnées entre deux systèmes ou bien une diffusion plus large sur le Web.

TEF comme format d'échange

Dans le premier cas, il s'agit d'un échange de métadonnées entre deux systèmes d'information bien identifiés, selon une procédure agréée par les deux parties. C'est précisément ce qui est prévu par le dispositif national de promotion des thèses électroniques. L'application STAR, gérée par l'ABES, recevra des métadonnées TEF générées et envoyées par les applications de gestion des thèses des établissements de soutenance. Le format XML de TEF est le format d'échange qui permettra à ces différentes applications de partager ces données normalisées. Il n'est qu'un format d'échange au sens où les applications locales auront à exporter du TEF et STAR à en importer. TEF n'a pas vocation à devenir un format interne, ni pour les premières, ni pour la seconde.

Pourtant, grâce à sa structure modulaire, TEF peut rendre des services à l'intérieur même d'un système d'information. TEF est composé de différents blocs de métadonnées qui peuvent provenir d'applications et de sources différentes : métadonnées en provenance des outils administratifs, métadonnées extraites du document lui-même, métadonnées générées automatiquement (métadonnées de conservation), métadonnées bibliographiques saisies par les bibliothécaires... Dans le cadre d'un système d'information, les données ne sont saisies qu'une fois, mais réutilisées plusieurs fois, dans différents contextes. Etant donné son organisation modulaire, TEF pourrait être utilisé par un tel système pour échanger des informations d'une application à une autre. Par exemple, le bloc des métadonnées administratives (tef_admin_these) pourrait être utilisé par l'école doctorale pour envoyer des informations à l'application de diffusion des thèses. Ce mode d'utilisation de TEF à l'intérieur d'un système d'information n'est exposé ici qu'à titre d'exemple et d'illustration de son organisation par blocs. Le point crucial reste la capacité d'un système d'information à échanger du TEF avec l'extérieur.

TEF comme format de référence

Le format TEF peut aussi servir de format de référence au sens où une institution peut souhaiter conserver ses métadonnées de thèse sous une forme indépendante des outils informatiques qui les exploitent. Grâce aux technologies standard qu'il intègre (XML, METS, Dublin Core, W3C XML Schema, Schematron), grâce au modèle conceptuel d'après lequel sa structure de données est construite, TEF peut contribuer à la conservation à long terme d'informations stratégiques sur les thèses. Par ailleurs, ces informations peuvent aller au-delà des métadonnées explicitement prévues par le format TEF, puisqu'il offre un mécanisme d'extension qui permet d'y ajouter des informations d'intérêt strictement local. Sur le modèle de METS, TEF n'est pas seulement une liste achevée d'éléments XML, mais aussi une enveloppe au contenu variable.

TEF comme outil de validation XML

Grâce aux technologies XML standard, le format d'échange XML de TEF sert aussi d'outil de validation. Les contrôles effectués conjointement par les schémas XML de TEF et ses règles Schematron permettent de vérifier qu'une instance TEF est bien conforme à la recommandation. Dans le cas où deux systèmes souhaitent échanger des métadonnées TEF qui ne soient pas strictement conformes, l'ensemble des règles Schematron peut facilement être amendé. En modifiant, ajoutant ou retirant certaines règles, on obtient un outil de validation XML adapté à des besoins particuliers.

Disséminer des métadonnées sur le Web

A côté de ces échanges proprement dit, les métadonnées TEF peuvent être utilisées dans la perspective de leur dissémination à l'échelle globale du Web. Grâce au protocole OAI-PMH, par exemple, les métadonnées TEF peuvent être récupérées et exploitées de manière très libre. Le fournisseur des métadonnées n'a pas besoin de connaître ni de s'entendre avec l'organisme qui les "moissonne" et les exploite. Un tel mode de dissémination favorise des usages nouveaux et variés des mêmes métadonnées (base de la production des chercheurs d'un établissement ou d'un ensemble d'établissements, bases disciplinaires, bases de thèses, outils infométriques, systèmes de pilotage de la recherche...). Plus les métadonnées des thèses seront utilisées, et ce dans des contextes différents, plus les thèses françaises seront visibles et valorisées.

L'encodage des métadonnées TEF en RDF va dans le même sens. Si RDF n'est pas le meilleur outil pour échanger du TEF complet et valide entre deux applications, il permettra de multiplier encore la visibilité et la réutilisation des métadonnées TEF sur le Web. Sur ce point, cf. l'introduction au chapitre 3.

TEF comme format pivot

Enfin, en tant que format pivot, TEF peut servir de point de départ vers d'autres formats de métadonnées. Par exemple, la conversion de TEF vers Dublin Core est immédiate puisque TEF est construit autour d'un noyau Dublin Core. Il en est de même pour le format ETD-MS dédié aux thèses ou pour les métadonnées de ressources pédagogiques.

Les métadonnées de thèse issues de TEF peuvent encore être intégrées au sein même des documents primaires. Avec ou sans conversion, des éléments TEF peuvent être inclus dans une page HTML ou XHTML, dans les propriétés d'un document PDF, dans l'en-tête d'un document TEI... On peut aussi imaginer que les pages liminaires d'une thèse soient générées automatiquement à partir d'une notice TEF.

Adapter TEF à des besoins particuliers

Pour répondre à des besoins particuliers, une institution peut décider de restreindre, d'étendre ou d'adapter TEF.

Restreindre TEF signifie ajouter à TEF des contraintes encore plus fortes. Il peut s'agir de rendre obligatoire un élément facultatif ou d'imposer une liste de valeurs là où du texte libre est autorisé. Pour ce faire, il sufffira en général d'amender les règles Schematron, sans avoir à modifier les schémas XML METS, TEF, METS Rights ou Dublin Core.

Etendre TEF signifie d'abord ajouter des sections, des éléments ou des attributs METS qui ne sont pas prévus par la recommandation TEF. Comme il est mentionné plus haut, TEF n'utilise pas toutes les possibilités de METS, mais il ne les interdit pas, sauf si elles rentrent en contradiction avec des contraintes TEF. Ainsi, à côté du bloc de métadonnées descriptives tef_desc_these, rien n'interdit d'associer à la thèse un autre bloc de métadonnées descriptives. Il en est de même pour les métadonnées administratives, ce qui permet d'utiliser TEF pour des métadonnées de gestion locales qui ne sont pas prévues par la recommandation en tant que telles. Ce type d'extensions à TEF n'implique aucune modification des schémas XML ni des règles Schematron officielles. De telles notices TEF étendues sont parfaitement valides. Il convient seulement de rappeler le fait que ces extensions risquent de ne pas être comprises par une autre application conforme à TEF. Par définition, ces extensions correspondent à une pratique strictement locale ou à une convention expresse entre deux partenaires.

Etendre TEF peut aussi signifier introduire dans les blocs de métadonnées TEF de nouveaux éléments qui sont étrangers à TEF comme à METS. Dans ce cas, une notice étendue ne sera pas conforme à TEF.

Au lieu d'étendre TEF, une application donnée pourrait décider de se passer de certains éléments que la recommandation exige. Dans le cadre d'un workflow, par exemple, la production d'une notice TEF est divisée en différentes étapes. Comme les applications intervenant en amont ne peuvent disposer de toutes les informations obligatoires, elles enverront vers l'aval des notices incomplètes et donc invalides. Ces notices peuvent être partiellement valides, au sens où les informations déjà présentes sont conformes aux prescriptions. Le vocabulaire Schematron permet d'ailleurs de regrouper les règles par phase. A chaque phase du workflow, on ne testera que les contraintes pertinentes. Une notice TEF peut dès lors être valide relativement à une phase donnée, bien qu'invalide au sens strict. Ce n'est qu'en bout de chaîne que la notice sera complète et valide au sens global de la recommandation TEF. Dans une autre perspective, envisagée à la fin du chapitre suivant, un établissement peut décider d'utiliser TEF pour traiter des documents qui ne sont pas des thèses au sens strict (cf. le chapitre qui suit). Cela suppose de modifier en profondeur les règles Schematron, mais pas nécessairement le schéma METS ni les schémas TEF.