Analyse contrastive des verbes dans des corpus médicaux et création d’une ressource verbale de simplification de textes
Auteur / Autrice : | Ornella Wandji Tchami |
Direction : | Dany Amiot, Ulrich Heid |
Type : | Thèse de doctorat |
Discipline(s) : | Science du Langage - Spécialité Linguistique computationnelle |
Date : | Soutenance le 26/02/2018 |
Etablissement(s) : | Université de Lille (2018-2021) en cotutelle avec Universität Hildesheim |
Ecole(s) doctorale(s) : | École doctorale Sciences de l'homme et de la société (Lille ; 2006-....) |
Partenaire(s) de recherche : | Laboratoire : Savoirs, textes, langage (Villeneuve d'Ascq, Nord) |
Jury : | Président / Présidente : Christiane Maas |
Examinateurs / Examinatrices : Dany Amiot, Ulrich Heid, Christiane Maas, Anne-Laure Ligozat, Amalia Todiraşcu-Courtier, Natalia Grabar | |
Rapporteurs / Rapporteuses : Anne-Laure Ligozat |
Mots clés
Résumé
Grâce à l’évolution de la technologie à travers le Web, la documentation relative à la santé est de plus en plus abondante et accessible à tous, plus particulièrement aux patients, qui ont ainsi accès à une panoplie d’informations sanitaires. Malheureusement, la grande disponibilité de l’information médicale ne garantit pas sa bonne compréhension par le public visé, en l’occurrence les non-experts. Notre projet de thèse a pour objectif la création d’une ressource de simplification de textes médicaux, à partir d’une analyse syntaxico-sémantique des verbes dans quatre corpus médicaux en français qui se distinguent de par le degré d’expertise de leurs auteurs et celui des publics cibles. La ressource conçue contient 230 patrons syntaxicosémantiques des verbes (appelés pss), alignés avec leurs équivalents non spécialisés. La méthode semi-automatique d’analyse des verbes appliquée pour atteindre notre objectif est basée sur quatre tâches fondamentales : l’annotation syntaxique des corpus, réalisée grâce à l’analyseur syntaxique Cordial (Laurent, Dominique et al, 2009) ; l’annotation sémantique des arguments des verbes, à partir des catégories sémantiques de la version française de la terminologie médicale Snomed Internationale (Côté, 1996) ; l’acquisition des patrons syntactico-sémantiqueset l’analyse contrastive du fonctionnement des verbes dans les différents corpus. Les patrons syntaxico-sémantiques des verbes acquis au terme de ce processus subissent une évaluation (par trois équipes d’experts en médecine) qui débouche sur la sélection des candidats constituant la nomenclature de la ressource de simplification. Les pss sont ensuite alignés avec leurs correspondants non spécialisés, cet alignement débouche sur le création de la ressource de simplification, qui représente le résultat principal de notre travail de thèse. Une évaluation du rendement du contenu de la ressource a été effectuée avec deux groupes d’évaluateurs : des linguistes et des non-linguistes. Les résultats montrent que la simplification des pss permet de faciliter la compréhension du sens du verbe en emploi spécialisé, surtout lorsque un certains paramètres sont réunis.