CELINE, vers un correcteur lexico-syntaxique adaptatif et semi-automatique
Auteur / Autrice : | Jacques Menezo |
Direction : | Jacques Courtin |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1999 |
Etablissement(s) : | Grenoble INPG |
Partenaire(s) de recherche : | Laboratoire : Institut d'informatique et mathématiques appliquées (Grenoble ; 1989-2006) |
Mots clés
Mots clés libres
Résumé
Cette thèse aborde la spécification et la réalisation de CELINE, outil de correction des erreurs basé sur une architecture multi-agents à deux niveaux : 1) Un système lourd, renfermant l'ensemble du savoir linguistique (multi-domaines par rapport à l'univers du discours), et générateur de systèmes individualisés. Les agents peuvent être considérés comme imparfaits ou partiellement inadaptés. Ils sont mis en concurrence par domaine d'expertise. 2) Un système léger implanté sur le site du rédacteur, système construit par apprentissage par le système central à partir des travaux de ce rédacteur. La spécification du système se construit tout au long des chapitres. La problématique de la correction des erreurs et la finalité de la conception d'un système de correction le plus automatique possible, avec des prises de décision à faible granularité reposant sur des critères multi-niveaux, nous entraînent vers un besoin de coopération justifiant une réalisation multi-agents. Une taxinomie des erreurs et des rappels sur l'analyse linguistique nous permet d'établir un début de structure du tableau noir du système. Nous consolidons nos choix par une comparaison du système attendu avec quelques prototypes du domaine. Nous examinons ensuite les comportements sociaux de deux agents chargés de définir l'un un modèle linguistique partiel suffisant du rédacteur et l'autre un sous-ensemble pertinent du système global. Nous découvrons alors le modèle de communication des agents et complétons notre structure de données par les marques de validité. La méthode des structures permet une quantification, incluse dans le tableau noir, de la correction des fautes d'accords. Après une approche des systèmes multi-agents, nous présentons une synthèse de l'architecture de CELINE et du fonctionnement des pilotes et de quelques agents. Un bilan rapide, précèdera en conclusion, une mise en situation du système proposé dans le cadre des industries de la langue et dans un environnement réseau du type Internet