En tant qu'oeuvre de l'esprit et document administratif, une thèse est soumise à des conditions juridiques, qu'elles soient légales, contractuelles ou réglementaires. Ces contraintes juridiques relèvent essentiellement du droit de la propriété intellectuelle et du droit administratif. Toute exploitation d'une thèse doit respecter ces contraintes. Pour les respecter, il faut les connaître. C'est pourquoi TEF comprend des métadonnées de droits qui doivent permettre de déterminer quels usages d'une thèse sont autorisés, dans quel contexte, à quel moment, à quelles conditions... Une notice TEF n'a en elle-même aucun statut juridique : ce n'est ni un acte administratif, ni un contrat de cession de droits. En revanche, une notice TEF doit exprimer le contenu juridique de tels documents, qui existent par ailleurs sous une forme officielle.
TEF doit exprimer les contraintes juridiques suivantes :
l'autorisation du chef d'établissement
l'autorisation de l'auteur
l'autorisation des ayant droits sur les ressources externes
Comment structurer ce type d'informations ? En l'absence de contrat-type, cette structuration doit rester ouverte. Il est trop tôt pour utiliser un langage d'expression des droits très fin et très structuré comme ODRL (qui s'appuie explicitement sur les FRBR) ou REL[10] . La structuration très forte de ces formats XML vise à automatiser la gestion des oeuvres soumises à droits. Il n'est pas sûr qu'une automatisation très poussée soit utile dans le cas des thèses. Pour autant, il apparaît insuffisant d'exprimer ces contraintes juridiques par du simple texte libre.
Entre ces deux solutions, TEF propose une structuration intermédiaire des données, en ayant recours au schéma XML METS Rights. Comme son nom l'indique, ce schéma est prévu pour structurer des métadonnées de droits dans le contexte d'un document METS.
Ce bloc de métadonnées de droits :
<mets:rightsMD ID="a121"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_etablissement_these"> <mets:xmlData> <metsRights:RightsDeclarationMD> <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC"> <metsRights:Permissions DISPLAY="true" DUPLICATE="true"/> </metsRights:Context> </metsRights:RightsDeclarationMD> </mets:xmlData> </mets:mdWrap> </mets:rightsMD>
signifie que le chef d'établissement où la thèse a été soutenue donne l'autorisation de la diffuser auprès du grand public ("GENERAL PUBLIC"), mais aussi de la reproduire. En d'autres termes, il autorise sa diffusion (représentation et reproduction). TEF s'intéressant aux thèses électroniques, "GENERAL PUBLIC" est interprété comme signifiant "Internet".
Une instance METS Rights permet essentiellement à un ayant droits d'autoriser (metsRights:permissions) un groupe d'utilisateurs (CONTEXTCLASS) à faire certains usages d'une ressource.
Parmi les groupes d'utilisateurs prévus par le schéma, deux d'entre eux intéressent TEF tout particulièrement :
GENERAL PUBLIC (= internet)
INSTITUTIONAL AFFILIATE (membres de l'institution = Intranet)
Les autres groupes prévus sont :
REPOSITORY MGR (= gestionnaire de la base)
MANAGED GRP (à définir par convention)
ACADEMIC USER (= groupe des enseignants et chercheurs)
OTHER (autre type de groupe ; à préciser avec l'attribut OTHERCONTEXTTYPE)
METS Rights permet aussi de définir ses propres groupes d'utilisateurs (avec l'attribut OTHERCONTEXTTYPE).
Les types d'usages prévus sont :
DISCOVER (référencement - accès aux métadonnées)
DISPLAY (affichage)
COPY (réutilisation)
DUPLICATE (reproduction)
MODIFY (modification)
DELETE (suppression)
PRINT (impression)
On peut aussi définir un nouveau type d'usage (avec l'attribut OTHERPERMITTYPE).
Toute autorisation doit être explicite. Si un des usages n'est pas mentionné, il est présumé ne pas avoir été cédé. En d'autres termes, l'absence de l'attribut DELETE, par exemple, équivaut à la présence de : DELETE="false".
Enfin, METS Rights permet d'apporter des restrictions aux autorisations accordées. Il prévoit différents types de restrictions :
QUALITY (qualité)
FORMAT (format)
UNIT (unité)
WATERMARK (filigrane)
PAYMENT (facturation)
COUNT (quantité)
ATTRIBUTION (attribution de paternité)
RE-USE (usage dérivé)
TIME (temps)
TRANSFERPERMISSIONS (transfert des droits à un tiers)
Ces nombreux types de restrictions permettent d'exprimer des conditions juridiques très subtiles. Pourtant, la formulation de la restriction elle-même se fait en texte libre. En raison de cette absence de structuration, les restrictions compromettent toute exploitation automatique de ces métadonnées de droits. C'est pourquoi TEF se propose de normaliser l'expression des restrictions de type temporel (TIME) car elles concernent notamment la question cruciale de la confidentialité.
Ainsi, la période de confidentialité imposée par le chef d'établissement s'exprimera de la manière suivante :
<metsRights:Constraints CONSTRAINTTYPE="TIME"> <metsRights:ConstraintDescription>confidentialité 2006-01-01 2006-12-31 </metsRights:ConstraintDescription> </metsRights:Constraints>
De même, une restriction temporelle imposée par l'auteur ou un ayant droits sur une ressource externe s'exprimera ainsi :
<metsRights:Constraints CONSTRAINTTYPE="TIME"> <metsRights:ConstraintDescription>restriction 2007-01-01 2008-06-30 </metsRights:ConstraintDescription> </metsRights:Constraints>
Cette structuration a minima doit permettre à un système de gestion de documents électroniques d'identifier automatiquement les thèses dont la période de confidentialité arrive à terme. Si, demain, il existe à l'échelle nationale des contrats-types, il sera possible de pousser plus avant la structuration et de faciliter ainsi une gestion automatisée plus fine.
En complément, il est possible d'exprimer toutes ces conditions juridiques en texte libre, grâce à l'élément metsRights:RightsDeclaration. Cet élément peut aussi contenir, par exemple, un lien hypertexte vers le contrat de cession type utilisé par l'établissement.
(...) <metsRights:RightsDeclarationMD> <metsRights:RightsDeclaration>L'auteur autorise l'affichage, la reproduction et l'impression de la présente thèse sur Internet. La réutilisation (COPY) n'est pas autorisée...... </metsRights:RightsDeclaration> <metsRights:RightsDeclaration> http://www.untel-univ.fr/theses/contrat </metsRights:RightsDeclaration> <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC"> <metsRights:Permissions COPY="false" DISPLAY="true" DUPLICATE="true" PRINT="true"/> </metsRights:Context> </metsRights:RightsDeclarationMD> (...)
Comment consolider les différentes contraintes juridiques qui portent sur une thèse ?
Les autorisations accordées par le chef d'établissement, l'auteur et les tiers peuvent entrer en conflit les unes avec les autres. Il suffit que l'une des parties s'oppose à tel ou tel usage pour que les autorisations accordées par les autres parties soient privées d'effet.
Il faut donc distinguer entre les autorisations qui portent sur une thèse et l'état juridique consolidé de cette thèse. Prenons l'exemple d'une thèse ne contenant aucune ressource externe. L'état juridique de la thèse ne dépend alors que des autorisations du chef d'établissement et de l'auteur. Si l'un comme l'autre autorise la diffusion sur Internet sans aucune restriction, alors la thèse est diffusable sur Internet. Il suffit que l'un des deux s'y oppose pour que l'état juridique de la thèse s'inverse : la thèse n'est plus diffusable sur Internet.
Même dans des cas plus complexes, il est possible de déduire automatiquement l'état juridique consolidé de la thèse, à partir des autorisations. Ainsi, pour reprendre notre cas d'école, si le chef d'établissement impose la confidentialité entre le 1er janvier 2006 et le 31 décembre 2006 et l'auteur une restriction entre le 1er janvier 2006 et le 30 juin 2008, alors l'état juridique de la thèse est le suivant : pas de diffusion sur Internet entre le 1er janvier 2007 et le 30 juin 2008 :
<metsRights:Constraints CONSTRAINTTYPE="TIME"> <metsRights:ConstraintDescription>restriction 2006-01-01 2008-06-30 </metsRights:ConstraintDescription> </metsRights:Constraints>
Cet état juridique consolidé est exprimé dans un nouveau bloc MetsRights.
Si des restrictions autres que temporelles sont utilisées, il devient impossible de déduire automatiquement l'état juridique consolidé à partir des différentes autorisations.
Calcul des droits en présence de ressources externes
La présence ou l'absence des ressources externes vient compliquer la situation. Pour diffuser une thèse sur travaux, en effet, il faut obtenir l'autorisation des éditeurs des articles (TRAVAUX) qui composent la thèse. De même, si une thèse intègre des images appartenant à un tiers (RESSOURCE_TIERS), l'autorisation de ce dernier est nécessaire. Pour connaître l'état juridique consolidé de la thèse, il faut donc prendre en compte les autorisations accordées ou non par les tiers. En théorie, même si le chef d'établissement et l'auteur accordent toutes leurs autorisations, mais que le propriétaire d'une seule image intégrée à la thèse les refuse, la diffusion de la thèse est bloquée.
C'est précisément pour éviter ces conséquences qu'on peut choisir de produire une version incomplète de la thèse, en l'amputant de l'image externe. Dès lors, rien ne s'oppose à la diffusion de la version incomplète de la thèse.
C'est pourquoi l'état juridique consolidé ne porte pas sur la thèse en tant que telle, mais sur chacune de ses versions. En effet, comme l'état juridique d'une thèse dépend de son contenu, il peut différer en fonction de la version considérée.
Cette logique générale basée sur le contenu présuppose que deux éditions d'une même version ont nécessairement le même état juridique. L'expérience dira si ce parti pris est viable ou non.
Le schéma qui suit résume cette logique.
tef_droits_etablissement_these + tef_droits_auteur_these + => tef_droits_version tef_desc_version + tef_droits_externe
S'il n'existe pas de restrictions ou seulement une restriction de type temporelle, cette logique des droits est automatisable. On peut calculer l'état consolidé d'une version en connaissant les différentes autorisations et le contenu de chaque version. La recommandation TEF elle-même ne fournit ni un algorithme ni un programme pour effectuer ce calcul.
Exemple complet :
<mets:mets> (...) <!-- Description de la version incomplète --> <mets:dmdSec ID="desc_version2"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_version"> <mets:xmlData> <tef:version> <tef:manque> <tef:ressourceID>tiers1</tef:ressourceID> <tef:noteVersion>Manquent les cartes issues de cette ressource externe</tef:noteVersion> </tef:manque> <tef:versionID scheme="CyberdocsLyon2">dcrozat04</tef:versionID> </tef:version> </mets:xmlData> </mets:mdWrap> </mets:dmdSec> (...) <!-- Autorisations --> <mets:rightsMD ID="dr_expr_univ"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_etablissement_these"> <mets:xmlData> <metsRights:RightsDeclarationMD> <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC"> <metsRights:Permissions COPY="true" DISPLAY="true" DUPLICATE="true" PRINT="true"/> <metsRights:Constraints CONSTRAINTTYPE="TIME"> <metsRights:ConstraintDescription> confidentialité 2006-01-01 2006-12-12 </metsRights:ConstraintDescription> </metsRights:Constraints> </metsRights:Context> </metsRights:RightsDeclarationMD> </mets:xmlData> </mets:mdWrap> </mets:rightsMD> <mets:rightsMD ID="dr_expr_thesard"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_auteur_these"> <mets:xmlData> <metsRights:RightsDeclarationMD> <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC"> <metsRights:Permissions COPY="true" DISPLAY="true" DUPLICATE="true" PRINT="true"/> </metsRights:Context> </metsRights:RightsDeclarationMD> </mets:xmlData> </mets:mdWrap> </mets:rightsMD> <mets:rightsMD ID="droits_expr_tiers_1"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_externe"> <mets:xmlData> <metsRights:RightsDeclarationMD> <metsRights:RightsHolder> <metsRights:RightsHolderName> Orange Publishing</metsRights:RightsHolderName> </metsRights:RightsHolder> <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC"> <metsRights:Permissions COPY="false" DISPLAY="false" DUPLICATE="false" PRINT="false"/> </metsRights:Context> </metsRights:RightsDeclarationMD> </mets:xmlData> </mets:mdWrap> </mets:rightsMD> <!-- Etat juridique de la version complète --> <mets:rightsMD ID="droits_version1"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_version"> <mets:xmlData> <metsRights:RightsDeclarationMD> <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC"> <metsRights:Permissions COPY="false" DISPLAY="false" DUPLICATE="false" PRINT="false"/> </metsRights:Context> <metsRights:Constraints CONSTRAINTTYPE="TIME"> <metsRights:ConstraintDescription> confidentialité 2006-01-01 2006-12-12 </metsRights:ConstraintDescription> </metsRights:Constraints> </metsRights:RightsDeclarationMD> </mets:xmlData> </mets:mdWrap> </mets:rightsMD> <!-- Etat juridique de la version incomplète, amputée de la ressource externe --> <mets:rightsMD ID="droits_version2"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_version"> <mets:xmlData> <metsRights:RightsDeclarationMD> <metsRights:Context CONTEXTCLASS="GENERAL PUBLIC"> <metsRights:Permissions COPY="true" DISPLAY="true" DUPLICATE="true" PRINT="true"/> </metsRights:Context> <metsRights:Constraints CONSTRAINTTYPE="TIME"> <metsRights:ConstraintDescription> restriction 2006-01-01 2006-12-12 </metsRights:ConstraintDescription> </metsRights:Constraints> </metsRights:RightsDeclarationMD> </mets:xmlData> </mets:mdWrap> </mets:rightsMD>
Dans cet exemple, la thèse comporte une ressource externe (une image JPEG). L'auteur accorde toutes les autorisations [11] sans aucune restriction. Le chef d'établissement assortit ses autorisations d'une période de confidentialité. L'éditeur refuse toutes les autorisations. La première version de la thèse est complète : elle comprend donc l'image en question. La seconde version est amputée de l'image. Dès lors, on peut déduire automatiquement l'état juridique consolidé de chaque version :
Version complète : dans le contexte d'Internet, on ne peut ni la réutiliser, ni l'afficher, ni la reproduire, ni l'imprimer. La confidentialité n'a ici aucun effet, puisqu'elle ne fait qu'ajouter une impossibilité provisoire à une impossibilité systématique et définitive.
Version incomplète : dans le contexte d'Internet, tous les usages mentionnés sont permis, passée la période de confidentialité d'un an. Les interdictions de l'éditeur n'ont plus aucun effet puisque son image a été retirée.
[10] Voir le rapport rédigé pour la Bibliothèque du Congrès par Karen Coyle : Rights expression languages: a report for the Library of Congress (2004. http://www.loc.gov/standards/relreport.pdf).
[11] Pour simplifier l'exemple, on a explicité les principaux usages de la thèse. On ne s'intéresse pas aux autres, même si ne pas les mentionner revient à ne pas les autoriser.