Thèse soutenue

Acquisition sémantique en langue générale : la paradocumentation textuelle pour l'indexation des documents audiovisuels sur la politique

FR  |  
EN
Auteur / Autrice : Karine Lespinasse Ide Lafargue
Direction : Benoît Habert
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance en 2002
Etablissement(s) : Paris 3

Mots clés

FR

Résumé

FR  |  
EN

A l'INA (Institut National de l'Audiovisuel), lieu des archives télévisées françaises, nous proposons des pistes de traitements automatisés de la " paradocumentation ". La paradocumentation rassemble les documents (textuels, photographiques) qui jalonne le cycle de vie du document audiovisuel. Dans la mesure où les " péritextes " existent au format électronique, il est possible de les constituer en corpus dont le contenu est étroitement lié au document audiovisuel et qui peuvent donc enrichir la description documentaire. L'enjeu scientifique réside dans l'exploitation des résultats de traitements appliqués à une langue générale avec une approche développée pour les langages techniques (méthodes, outils). Ce choix s'explique de manière pragmatique (absence d'autres outils) mais aussi théorique : la langue générale est un défi pour les traitements automatisés. Nous avons mené plusieurs expériences d'acquisition sémantique, sur différents " péritextes " pointant sur des émissions de politique : notices documentaires, transcriptions de bande-son, articles de presse. . .