Détection et suivi d’événements dans des documents de presse historiques - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Detection and Tracking of Events in Historical Press Documents

Détection et suivi d’événements dans des documents de presse historiques

Résumé

Current campaigns to digitise historical documents from all over the world are opening up new avenues for historians and social science researchers. The understanding of past events is renewed by the analysis of these large volumes of historical data: unravelling the thread of events, tracing false information are, among other things, possibilities offered by the digital sciences. This thesis focuses on these historical press articles and suggests, through two opposing strategies, two analysis processes that address the problem of tracking events in the press. A simple use case is for instance a digital humanities researcher or an amateur historian who is interested in an event of the past and seeks to discover all the press documents related to it. Manual analysis of articles is not feasible in a limited time. By publishing algorithms, datasets and analyses, this thesis is a first step towards the publication of more sophisticated tools allowing any individual to search old press collections for events, and why not, renew some of our historical knowledge.
Les campagnes actuelles de numérisation de documents historiques issus de fonds documentaires du monde entier ouvrent de nouvelles voies aux historiens, historiennes et spécialistes des sciences sociales. La compréhension des événements du passé se renouvelle par l’analyse de ces grands volumes de données historiques : découdre le fil des événements, tracer de fausses informations sont, entre autres, des possibilités offertes par les sciences du numérique. Cette thèse s’intéresse à ces articles de presse historique et propose, à travers deux stratégies que tout oppose, deux processus d’analyse répondant à la problématique de suivi des événements dans la presse. Un cas d’utilisation simple est celui d’une équipe de recherche en humanités numériques qui s’intéresse à un événement particulier du passé. Ses membres cherchent à découvrir tous les documents de presse qui s’y rapportent. L’analyse manuelle des articles est irréalisable dans un temps contraint. En publiant à la fois algorithmes, jeux de données et analyses, cette thèse est un premier jalon vers la publication d’outils plus sophistiqués. Nous permettons à tout individu de fouiller les fonds de presse ancienne à la recherche d’événements, et pourquoi pas, renouveler certaines de nos connaissances historiques.
Fichier principal
Vignette du fichier
2022BERNARD196485.pdf (18.09 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04115986 , version 1 (25-01-2023)
tel-04115986 , version 2 (02-06-2023)

Identifiants

  • HAL Id : tel-04115986 , version 2

Citer

Guillaume Bernard. Détection et suivi d’événements dans des documents de presse historiques. Informatique et langage [cs.CL]. Université de La Rochelle, 2022. Français. ⟨NNT : 2022LAROS032⟩. ⟨tel-04115986v2⟩
184 Consultations
79 Téléchargements

Partager

Gmail Facebook X LinkedIn More