Interopérabilité Sémantique Multi-lingue des Ressources Lexicales en Données Liées Ouvertes

Andon Tchechmedjiev

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Interopérabilité Sémantique Multi-lingue des Ressources Lexicales en Données Liées Ouvertes

FR |

EN

Auteur / Autrice :	Andon Tchechmedjiev
Direction :	Gilles Sérasset
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 14/10/2016
Etablissement(s) :	Université Grenoble Alpes (ComUE)
Ecole(s) doctorale(s) :	École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique de Grenoble (Isère, France ; 2007-....)
Jury :	Président / Présidente : Éric Gaussier
	Examinateurs / Examinatrices : Jérôme Goulian, Éric Gaussier, Denis Maurel, Nabil Hathout
	Rapporteurs / Rapporteuses : Mathieu Lafourcade, Roberto Navigli

Mots clés

FR |

EN

Mots clés contrôlés

Algorithmes

Traitement automatique du langage naturel

Mots clés libres

Désambigïsation lexicale multilingue

Interopérabilité

Ressources langagières

Résumé

FR |

EN

Lorsqu’il s’agit la construction de ressources lexico-sémantiques multilingues, la première chose qui vient à l’esprit, et la nécessité que les ressources à alignées partagent le même format de données et la même représentations (interopérabilité représentationnelle). Avec l’apparition de standard tels que LMF et leur adaptation au web sémantique pour la production de ressources lexico- sémantiques multilingues en tant que données lexicales liées ouvertes (Ontolex), l’interopérabilité représentationnelle n’est plus un verrou majeur. Cependant, en ce qui concerne l’interopérabilité des alignements multilingues, le choix et la construction du pivot interlingue est l’un des obstacles principaux. Pour nombre de ressources (par ex. BabelNet, EuroWordNet), le choix est fait d’utiliser l’Anglais, ou une autre langue comme pivot interlingue. Ce choix mène à une perte de contraste dans les cas où des sens du Pivot ont des lexicalisations différentes dans la même acception dans plusieurs autres langues. L’utilisation d’une pivot à acceptions interlingues, solution proposée il y a déjà plus de 20 ans, pourrait être viable. Néanmoins, leur construction manuelle est trop ardue du fait du manque d’experts parlant assez de langues et leur construction automatique pose problème du fait de l’absence d’une formalisation et d’une caractérisation axiomatique permettant de garantir leur propriétés. Nous proposons dans cette thèse de d’abord formaliser l’architecture à pivot interlingue par acceptions, en développant une axiomatisation garantissant leurs propriétés. Nous proposons ensuite des algorithmes de construction initiale automatique en utilisant les propriétés combinatoires du graphe des alignements bilingues, mais aussi des algorithmes de mise à jour garantissant l’interopérabilité dynamique. Dans un deuxième temps, nous étudions de manière plus pratique sur DBNary, un extraction périodique de Wiktionary dans de nombreuses éditions de langues, afin de cerner les contraintes pratiques à l’application des algorithmes proposés.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Interopérabilité Sémantique Multi-lingue des Ressources Lexicales en Données Liées Ouvertes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Interopérabilité Sémantique Multi-lingue des Ressources Lexicales en Données Liées Ouvertes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses