Thèse soutenue

Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues

FR  |  
EN
Auteur / Autrice : Yuliya Korenchuk
Direction : Amalia Todiraşcu-CourtierDelphine Bernhard
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 11/07/2017
Etablissement(s) : Strasbourg
Ecole(s) doctorale(s) : École doctorale Humanités (Strasbourg ; 2009-....)
Partenaire(s) de recherche : Laboratoire : Linguistique, langues, parole (Strasbourg)
Jury : Président / Présidente : Ulrich Heid
Rapporteurs / Rapporteuses : Ulrich Heid, Cecilia Zanni-Merk

Résumé

FR  |  
EN

Cette thèse propose une méthode pour alimenter une ontologie, une structure de concepts liés par des relations sémantiques, par des termes français, anglais et allemands à partir de corpus spécialisés comparables. Son apport principal est le développement des méthodes d'extraction utilisant des ressources endogènes apprises à partir de corpus et d'ontologie. Exploitant des n-grammes de caractères, elles sont disponibles et indépendantes vis-à-vis de la langue et du domaine. La première contribution porte sur l'utilisation des ressources morphologiques et morphosyntaxiques endogènes pour extraire des termes mono- et polylexicaux à partir de corpus. La deuxième contribution vise à exploiter des ressources endogènes pour identifier leurs traductions. La troisième contribution concerne la construction des familles morphologiques endogènes servant à alimenter l'ontologie.