Thèse soutenue

Améliorer LDA pour L’apprentissage d’ontologie

FR  |  
EN
Auteur / Autrice : Ziwei Xu
Direction : Fabrice GuilletMounira Harzallah
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 03/06/2021
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Laboratoire des Sciences du Numérique de Nantes
Jury : Président / Présidente : Giuseppe Berio
Examinateurs / Examinatrices : Ryutaro Ichise
Rapporteurs / Rapporteuses : Julien Velcin, Mohamed Hedi Karray

Mots clés

FR

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Cette thèse vise à tirer profit du modèle sémantique LDA pour améliorer la conceptualisation des termes en vue de l’apprentissage d’ontologie à partir de textes, où des termes similaires sont regroupés en fonction de concepts de base prédéfinis. Nous avons exploré le cadre classique du regroupement de termes et étudié l’impact des techniques de représentation des termes. Nous avons proposé des stratégies de regroupement de termes (term clustering) basées sur LDA, où des connaissances préalables sont utilisées pour semisuperviser LDA. De plus, nous avons construit la structure taxonomique de l’ontologie, en appliquant en interne les cadres de sous-catégorisation sur les phrases nominatives et en bénéficiant en externe des bases de connaissances. Notre stratégie de regroupement basée sur LDA a été plus performante que la majorité des travaux de regroupement dans le cadre classique. Notre approche optimale d’intégration des connaissances préalables a dépassé les performances de LDA de base et de seeded LDA. Le regroupement basé sur LDA pourrait contribuer à améliorer la formation des concepts à partir de termes pour l’apprentissage d’ontologie.