Thèse soutenue

Contribution à l'étude et au développement de modèles connexionnistes à apprentissage par renforcement : application à l'acquisition de comportement adaptatifs

FR  |  
EN
Auteur / Autrice : Samira Sehad
Direction : Norbert Giambiasi
Type : Thèse de doctorat
Discipline(s) : Automatique, traitement du signal et génie informatique
Date : Soutenance en 1996
Etablissement(s) : Montpellier 2

Résumé

FR

L'apprentissage par renforcement consiste a la construction d'une fonction de mise en correspondance entre les situations et les actions d'un agent en vue d'apprendre un comportement a partir de la mesure de la performance du comportement recherche. Cette mesure evalue qualitativement le comportement de l'agent. Dans cette these, le probleme de la generalisation de l'apprentissage par renforcement est aborde par une approche connexionniste, du fait de la propriete de generalisation des reseaux de neurones artificiels. Dans un premier temps, nous proposons un modele general avec lequel nous decrivons dans un meme formalisme differents algorithmes d'apprentissage par renforcement (le td-learning, le ahc-learning, le q-learning). Ensuite, nous presentons et discutons plusieurs implantations neuronales de ces algorithmes de renforcement (par reseaux multicouches, reseaux recurrents, rbf, cmac). Dans un second temps, nous proposons une implantation a l'aide des cartes auto-organisatrices de kohonen de l'algorithme de q-learning, le plus utilise des algorithmes de renforcement. Les attraits a notre implantation resident d'une part dans la generalisation obtenue: obtention d'un comportement correct a partir d'un sos-ensemble de situations-actions explorees et d'autre part dans la minimisation de la connaissance stockee: uniquement dediee a la resolution des comportements. A titre applicatif, nous realisons l'acquisition de comportements adaptatifs: evitement d'obstacles et rapproche du but. Des experimentations sont menees dans le monde reel avec le robot mobile khepera