Système de conjugaison, reconnaissance morphosyntaxique statistique lemmatisation automatique de la classe verbale du grec moderne standard
Auteur / Autrice : | Zacharoula-Pénélope Lembessi |
Direction : | Michel Eytan |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique linguistique |
Date : | Soutenance en 2006 |
Etablissement(s) : | Université Marc Bloch (Strasbourg) (1971-2008) |
Mots clés
Mots clés contrôlés
Résumé
Dans cette thèse nous présentons les résultats ainsi que la méthodologie adoptée pour la création d'un système d'analyse morphosyntaxique automatique et de lemmatisation sans dictionnaire des formes verbales monolexicales du grec moderne standard. Avec le modèle rétrograde MOSAIC (Koktova 1985) sur le chech comme point de départ, ainsi que d'autres modèles similaires sur le français (Caradec & Saada 1982) et le grec moderne (Lexifanis, Kotsanis & Maistros 1985), notre recherche a couvert 8. 485 lexèmes verbaux grecs, en prenant les données des dictionnaires les plus récents (Kyriacopoulou 1990, Iordanidou 1992, Kriaras 1995, Babiniotis 1998, Institut d'Études Néohelléniques 1998). Il a ainsi été créé: un nouveau système de conjugaison de 385 modèles qui sert à la génération automatique de tous les morphèmes lexicaux/radicaux ainsi que de toutes les formes flexionnelles monolexicales une base de données des séquences graphémiques finales qui permet l'attribution automatique de modèle de conjugaison à n'importe quel lemme verbal une base de données de 151. 527 séquences graphémiques finales, statistiquement établie et manuellement perfectionnée, qui peut s'employer pour la reconnaissance automatique de n'importe quelle forme verbale monolexicale et un système des règles morphophonologiques rétrogrades utilisées pour la lemmatisation linéaire des formes flexionnelles, qui fonctionne sur la base du nouveau système de conjugaison de 385 modèles.