Modélisation informatique de structures dynamiques de segments textuels pour l'analyse de corpus
Auteur / Autrice : | François Daoust |
Direction : | Jean-Marie Viprey, Yves Marcoux |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage |
Date : | Soutenance le 10/01/2011 |
Etablissement(s) : | Besançon |
Ecole(s) doctorale(s) : | Ecole doctorale Langages, Espaces, Temps, Sociétés (Besançon ; 1991-2016) |
Partenaire(s) de recherche : | Laboratoire : Edition, Langages, Littératures, Informatique, Arts, Didactiques, Discours (ELLIADD) (Besançon) |
Jury : | Président / Présidente : Jules Duchastel |
Examinateurs / Examinatrices : Jean-Marie Viprey, Yves Marcoux, Lou Burnard, André Salem | |
Rapporteurs / Rapporteuses : Lou Burnard, André Salem |
Mots clés
Résumé
L'objectif de la thèse est de proposer un modèle informatique pour représenter, construire et exploiterdes structures textuelles. Le modèle proposé s'appuie sur une représentation du texte sous la forme d'unplan lexique/occurrences augmenté de systèmes d'annotations lexicales et contextuelles, modèle dontune implantation a été réalisée dans le logiciel SATO dont on présente les fonctionnalités etl'organisation interne. La présentation d'un certain nombre de travaux rendent compte dudéveloppement et de l'utilisation du logiciel dans divers contextes.La prise en charge formelle des structures textuelles et discursives trouve un allié dans le langage debalisage XML et dans les propositions de la Text Encoding Initiative (TEI). Formellement, lesstructures construites sur les segments textuels correspondent à des graphes. Dans le contexte d'uneanalyse textuelle en élaboration, ces graphes sont multiples et partiellement déployés. La résolution deces graphes, au sens du rattachement des noeuds à des segments textuels ou à des noeuds d'autresgraphes, est un processus dynamique qui peut être soutenu par divers mécanismes informatiques. Desexemples tirés de la linguistique textuelle servent à illustrer les principes de l'annotation structurelle.Des considérations prospectives sur une implantation informatique d'un système de gestion del'annotation structurelle sont aussi exposées.