Thèse soutenue

Amelioration des classifieurs neuronaux par incorporation de connaissances explicites : application a la reconnaissance de caracteres manuscrits

FR  |  
EN
Auteur / Autrice : Holger Schwenk
Direction : Maurice Milgram
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1996
Etablissement(s) : Paris 6

Résumé

FR

Cette these est consacree a l'etude de l'incorporation de connaissances dans des classifieurs neuronaux avec application a la reconnaissance de caracteres statiques et dynamiques. Nous proposons une nouvelle architecture modulaire, le classifieur diabolo, qui n'utilise ni codage special, ni architecture complexe. Elle est basee sur des reseaux auto-associatifs, connus sous le nom de diabolo, qui apprennent un modele tres compact de chaque classe. L'incorporation de connaissances se fait par l'utilisation de la dite distance tangente comme fonction de cout. Elle permet d'obtenir une invariance par rapport a un jeu de transformations specifiees telles que la translation, la rotation ou meme l'epaississement. Nous avons egalement defini un algorithme d'apprentissage discriminant permettant ainsi de reunir de facon efficace deux proprietes importantes en reconnaissance de formes: l'invariance et la discrimination. Le classifieur diabolo a obtenu des resultats tres competitifs sur plusieurs bases internationales de caracteres statiques manuscrits, aussi bien en taux de reconnaissance qu'en complexite du calcul. Le taux d'erreur brute se chiffre a 2. 55% sur les lettres majuscules de la base nist, a environ 1% sur les chiffres de la meme base et a 2. 6% sur une base difficile de codes postaux segmentes de la poste francaise. Nous avons egalement applique les memes idees a la reconnaissance de caracteres ecrits a l'aide d'un stylo electronique. Le codage global du caractere entier permet d'exprimer des connaissances sur des deformations geometriques admissibles d'une facon tres intuitive. Le classifieur diabolo pour cette application commet 1. 2% d'erreur sur notre base de 203 scripteurs, la vitesse de reconnaissance s'eleve a 120 caracteres par seconde