Thèse soutenue

Modélisation informatique de structures dynamiques de segments textuels pour l'analyse de corpus

FR  |  
EN
Auteur / Autrice : François Daoust
Direction : Jean-Marie VipreyYves Marcoux
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 10/01/2011
Etablissement(s) : Besançon
Ecole(s) doctorale(s) : Ecole doctorale Langages, Espaces, Temps, Sociétés (Besançon ; 1991-2016)
Partenaire(s) de recherche : Laboratoire : Edition, Langages, Littératures, Informatique, Arts, Didactiques, Discours (ELLIADD) (Besançon)
Jury : Président / Présidente : Jules Duchastel
Examinateurs / Examinatrices : Jean-Marie Viprey, Yves Marcoux, Lou Burnard, André Salem
Rapporteurs / Rapporteuses : Lou Burnard, André Salem

Résumé

FR  |  
EN

L'objectif de la thèse est de proposer un modèle informatique pour représenter, construire et exploiterdes structures textuelles. Le modèle proposé s'appuie sur une représentation du texte sous la forme d'unplan lexique/occurrences augmenté de systèmes d'annotations lexicales et contextuelles, modèle dontune implantation a été réalisée dans le logiciel SATO dont on présente les fonctionnalités etl'organisation interne. La présentation d'un certain nombre de travaux rendent compte dudéveloppement et de l'utilisation du logiciel dans divers contextes.La prise en charge formelle des structures textuelles et discursives trouve un allié dans le langage debalisage XML et dans les propositions de la Text Encoding Initiative (TEI). Formellement, lesstructures construites sur les segments textuels correspondent à des graphes. Dans le contexte d'uneanalyse textuelle en élaboration, ces graphes sont multiples et partiellement déployés. La résolution deces graphes, au sens du rattachement des noeuds à des segments textuels ou à des noeuds d'autresgraphes, est un processus dynamique qui peut être soutenu par divers mécanismes informatiques. Desexemples tirés de la linguistique textuelle servent à illustrer les principes de l'annotation structurelle.Des considérations prospectives sur une implantation informatique d'un système de gestion del'annotation structurelle sont aussi exposées.