Initialisation et détermination de l'architecture des perceptrons multicouches
Auteur / Autrice : | Mohamed Karouia |
Direction : | Thierry Denoeux |
Type : | Thèse de doctorat |
Discipline(s) : | Contrôle des systèmes |
Date : | Soutenance en 1996 |
Etablissement(s) : | Compiègne |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Compiègne) |
Résumé
Le premier problème étudié dans cette thèse concerne l'initialisation des poids des perceptrons multicouches. Une nouvelle méthode a été proposée dans le cas particulier des problèmes de discrimination. Cette méthode utilise les facteurs discriminants issus d'une technique d'analyse factorielle discriminante de nature paramétrique ou non-paramétrique. Une étude expérimentale a permis de mettre en évidence une réduction du temps d'apprentissage et une amélioration sensible des performances en généralisation par rapport à l'initialisation aléatoire et, dans une moindre mesure, par rapport à l'initialisation par prototypes. Le second problème abordé est la question de détermination de l'architecture des perceptrons multicouches. La méthode incrémentale proposée initialise les vecteurs de poids par une technique d'analyse factorielle discriminante. L'algorithme d'apprentissage consiste en l'enchaînement de trois étapes : sélection et apprentissage de la dernière unité ajoutée seule, puis ajustement des poids de la couche de sortie, et finalement apprentissage du réseau entier. Cette stratégie, dont plusieurs variantes ont été étudiées, semble permettre d'atteindre de bonnes performances en termes de généralisation et de temps de calcul, notamment en comparaison d'autres algorithmes constructifs reposant sur des principes voisins.