Retour à l'accueil

A propos

Moteur de recherche des thèses de doctorat françaises, le site theses.fr a pour objet de référencer :

  • les thèses de doctorat en cours de préparation en France, si l'établissement d'inscription a fait le choix de les signaler et si le ou la doctorant(e) ne s'est pas opposé(e) à ce signalement.
  • les thèses de doctorat soutenues en France depuis 1985, quel que soit le support matériel de la thèse (imprimé ou numérique).
  • les personnes et les organismes en lien avec ces thèses.

Une base de données alimentée par les établissements de soutenance

theses.fr est la vitrine de données produites et validées par les différents personnels des établissements de l’enseignement supérieur français habilités à délivrer le doctorat (services de scolarité, écoles doctorales, bibliothèques et centres de documentation, services d’appui à la recherche…)

Les données affichées sur theses.fr proviennent des applications sources suivantes :

  • STEP (Signalement des Thèses en Préparation) pour les thèses en préparation
  • STAR (Signalement des Thèses et Archivage) pour les thèses soutenues déposées au format électronique
  • le catalogue collectif Sudoc pour les thèses soutenues déposées au format imprimé, les microfiches de thèses, les reproductions de thèses sur support imprimé ou électronique, ainsi que les thèses publiées chez un éditeur.

La base de données theses.fr tend à référencer l’ensemble des thèses de doctorat soutenues en France depuis 1985. Les lacunes peuvent être signalées via ABESstp, le guichet d’assistance en ligne de l’Abes .

En revanche, theses.fr ne référence pas :

  • les Habilitations à Diriger des Recherches (HDR)
  • les thèses d’exercice donnant lieu à la délivrance du diplôme d’Etat de docteur (en médecine, pharmacie, chirurgie dentaire ou chirurgie vétérinaire) 
  • les thèses de doctorat étrangères (y compris celles rédigées en français) 
  • les thèses de doctorat françaises soutenues avant 1985

Une interface et des API

Les données de theses.fr sont accessibles via le site www.theses.fr grâce à un moteur de recherche et une navigation à facettes. Un guide d’utilisation du moteur de recherche est mis à la disposition des utilisateurs. Conformément à la politique d’ouverture des données de l’Abes, theses.fr s’inscrit dans le mouvement du web de données et du linked data.

Les données brutes relèvent du domaine public et sont placées sous licence Etalab . Elles sont disponibles via une API XML .

Pour favoriser leur réutilisation, les données relatives aux thèses soutenues sont également disponibles sous forme d’un dump déposé et mis à jour annuellement sur le site data.gouv.fr : Thèses soutenues en France depuis 1985 . Un guide de réutilisation accompagne l’extraction.

Historique du projet « Portail des thèses »

Theses.fr v1

Objectifs initiaux du projet

theses.fr est une des applications du projet « Portail des thèses », confié à l’Abes en 2009 par le Ministère de l’enseignement supérieur et de la recherche. Le comité de décision et d’opération du projet « Portail des thèses » a validé les principales orientations d’une feuille de route qui comportait trois axes principaux :

  • Renforcer la visibilité nationale et internationale de la recherche doctorale française : theses.fr expose largement sur le web les données décrivant les thèses de doctorat
  • Servir le monde académique : theses.fr permet à la communauté scientifique d'avoir une connaissance aussi exacte que possible de l'état de la recherche doctorale en cours, au niveau national, local, par disciplines ou par thématiques de recherche
  • Servir le monde économique : en valorisant les travaux des doctorants et des docteurs, theses.fr vise à faciliter l’insertion professionnelle des jeunes chercheurs

Gouvernance du projet et principaux partenaires

Pour mener à bien theses.fr, l’Abes s’est entourée de nombreux partenaires.

Composition du Comité de décision et d’opération (CDO) du projet :

  • trois représentants du Ministère de l’enseignement supérieur de la recherche : Mission de l'information scientifique et technique et du réseau documentaire (MISTRD), Direction générale pour l'enseignement supérieur et l'insertion professionnelle (DGESIP), Direction générale pour la recherche et l'innovation (DGRI)
  • un représentant de la Conférence des Présidents d’Université
  • un représentant de la Conférence des Grandes Ecoles
  • un représentant des formations doctorales dans les établissements habilités
  • deux représentants de la recherche privée ou du monde économique
  • trois représentants des opérateurs documentaires nationaux des thèses en France : CNRS-INIST ,Atelier national de reproduction des thèses de Lille , CINES
  • trois représentants d’associations : l’Intelli’Agence (Association Bernard Gregory), l’ADBU (association des directeurs de bibliothèques universitaires), l’AURA (association du réseau des utilisateurs des produits de l’Abes)

Les comptes-rendus de décisions du CDO ont fait l’objet de billets sur le blog de l’Abes .


Versement progressif des données

Le versement dans theses.fr des données relatives aux thèses de doctorat françaises s’est fait progressivement :

  • Juillet 2011 : ouverture du site theses.fr qui, dans un premier temps, référence uniquement les thèses soutenues depuis 2006 et déposées au format électronique.

Elles sont 6 000 à être référencées en 2011.

  • Septembre 2011: intégration des sujets de thèses en préparation. Les données du Fichier Central des Thèses (FCT) sont versées dans theses.fr, soit plus de 66 000 sujets de thèses, principalement en Lettres, Sciences Humaines et Sociales. La même année, le FCT, maintenu par l’Université Paris Nanterre, est remplacé par l’application STEP, maintenue par l’Abes, ouverte à l’ensemble des établissements, toutes disciplines confondues.

L’utilisation de STEP étant facultative, tous les établissements ne référencent pas dans STEP et theses.fr les thèses préparées en leur sein. Le nombre d’établissements adhérents à STEP va néanmoins augmenter au fil des années. 

  • Mai 2013 : versement des données du Sudoc dans theses.fr. Toutes les thèses soutenues en France et archivées au format imprimé depuis 1985 sont destinées à être référencées dans theses.fr.

En 2013, elles représentent près de 250 000 documents.

  • Septembre 2016 : le dépôt électronique des thèses est rendu obligatoire.

Le nombre de thèses imprimées référencées dans theses.fr se stabilise à 300 000 : il n’augmentera plus que de manière marginale.

Depuis 2017, le nombre de thèses électroniques référencées augmente d’environ 14 000 documents chaque année.

Désormais, la quasi-totalité des établissements qui délivrent le doctorat signalent les sujets de thèses préparés en leur sein.

 

Theses.fr v2

A partir du printemps 2022, l’Agence Bibliographique de l’Enseignement Supérieur lance le projet de refonte du site theses.fr.

Les objectifs sont :

  • la refonte complète du socle technique : l’outil SolR est remplacé par Elastic Search
  • le développement d’une interface ergonomique, responsive et accessible
  • la mise en place d’un accès contrôlé, centralisé, aux thèses dont la diffusion est restreinte au périmètre de l’enseignement supérieur français

Le site est développé en grande partie en interne, y compris la partie graphique. Un prestataire externe est engagé pendant un an pour appuyer l’équipe technique sur le moteur de recherche consacré aux personnes.

La nouvelle version de theses.fr est déployée en production en 2024.