Thèse soutenue

Système de conjugaison, reconnaissance morphosyntaxique statistique lemmatisation automatique de la classe verbale du grec moderne standard

FR  |  
EN
Auteur / Autrice : Zacharoula-Pénélope Lembessi
Direction : Michel Eytan
Type : Thèse de doctorat
Discipline(s) : Informatique linguistique
Date : Soutenance en 2006
Etablissement(s) : Université Marc Bloch (Strasbourg) (1971-2008)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Dans cette thèse nous présentons les résultats ainsi que la méthodologie adoptée pour la création d'un système d'analyse morphosyntaxique automatique et de lemmatisation sans dictionnaire des formes verbales monolexicales du grec moderne standard. Avec le modèle rétrograde MOSAIC (Koktova 1985) sur le chech comme point de départ, ainsi que d'autres modèles similaires sur le français (Caradec & Saada 1982) et le grec moderne (Lexifanis, Kotsanis & Maistros 1985), notre recherche a couvert 8. 485 lexèmes verbaux grecs, en prenant les données des dictionnaires les plus récents (Kyriacopoulou 1990, Iordanidou 1992, Kriaras 1995, Babiniotis 1998, Institut d'Études Néohelléniques 1998). Il a ainsi été créé: un nouveau système de conjugaison de 385 modèles qui sert à la génération automatique de tous les morphèmes lexicaux/radicaux ainsi que de toutes les formes flexionnelles monolexicales une base de données des séquences graphémiques finales qui permet l'attribution automatique de modèle de conjugaison à n'importe quel lemme verbal une base de données de 151. 527 séquences graphémiques finales, statistiquement établie et manuellement perfectionnée, qui peut s'employer pour la reconnaissance automatique de n'importe quelle forme verbale monolexicale et un système des règles morphophonologiques rétrogrades utilisées pour la lemmatisation linéaire des formes flexionnelles, qui fonctionne sur la base du nouveau système de conjugaison de 385 modèles.