Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
Auteur / Autrice : | Yuliya Korenchuk |
Direction : | Amalia Todiraşcu-Courtier, Delphine Bernhard |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage |
Date : | Soutenance le 11/07/2017 |
Etablissement(s) : | Strasbourg |
Ecole(s) doctorale(s) : | École doctorale des Humanités (Strasbourg ; 2009-....) |
Partenaire(s) de recherche : | Laboratoire : Linguistique, langues, parole (Strasbourg) |
Jury : | Président / Présidente : Ulrich Heid |
Rapporteurs / Rapporteuses : Ulrich Heid, Cecilia Zanni-Merk |
Mots clés
Résumé
Cette thèse propose une méthode pour alimenter une ontologie, une structure de concepts liés par des relations sémantiques, par des termes français, anglais et allemands à partir de corpus spécialisés comparables. Son apport principal est le développement des méthodes d'extraction utilisant des ressources endogènes apprises à partir de corpus et d'ontologie. Exploitant des n-grammes de caractères, elles sont disponibles et indépendantes vis-à-vis de la langue et du domaine. La première contribution porte sur l'utilisation des ressources morphologiques et morphosyntaxiques endogènes pour extraire des termes mono- et polylexicaux à partir de corpus. La deuxième contribution vise à exploiter des ressources endogènes pour identifier leurs traductions. La troisième contribution concerne la construction des familles morphologiques endogènes servant à alimenter l'ontologie.