Contribution à l'étude et au développement de modèles connexionnistes à apprentissage par renforcement : application à l'acquisition de comportement adaptatifs

Samira Sehad

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Samira Sehad
Direction :	Norbert Giambiasi
Type :	Thèse de doctorat
Discipline(s) :	Automatique, traitement du signal et génie informatique
Date :	Soutenance en 1996
Etablissement(s) :	Montpellier 2

Mots clés

FR

Mots clés contrôlés

Informatique

Sciences du comportement

Cartes à mémoire

Modèles mathématiques

Réseaux neuronaux (informatique)

Connexionnisme

Acquisition des connaissances (systèmes experts)

Résumé

FR

L'apprentissage par renforcement consiste a la construction d'une fonction de mise en correspondance entre les situations et les actions d'un agent en vue d'apprendre un comportement a partir de la mesure de la performance du comportement recherche. Cette mesure evalue qualitativement le comportement de l'agent. Dans cette these, le probleme de la generalisation de l'apprentissage par renforcement est aborde par une approche connexionniste, du fait de la propriete de generalisation des reseaux de neurones artificiels. Dans un premier temps, nous proposons un modele general avec lequel nous decrivons dans un meme formalisme differents algorithmes d'apprentissage par renforcement (le td-learning, le ahc-learning, le q-learning). Ensuite, nous presentons et discutons plusieurs implantations neuronales de ces algorithmes de renforcement (par reseaux multicouches, reseaux recurrents, rbf, cmac). Dans un second temps, nous proposons une implantation a l'aide des cartes auto-organisatrices de kohonen de l'algorithme de q-learning, le plus utilise des algorithmes de renforcement. Les attraits a notre implantation resident d'une part dans la generalisation obtenue: obtention d'un comportement correct a partir d'un sos-ensemble de situations-actions explorees et d'autre part dans la minimisation de la connaissance stockee: uniquement dediee a la resolution des comportements. A titre applicatif, nous realisons l'acquisition de comportements adaptatifs: evitement d'obstacles et rapproche du but. Des experimentations sont menees dans le monde reel avec le robot mobile khepera

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Contribution à l'étude et au développement de modèles connexionnistes à apprentissage par renforcement : application à l'acquisition de comportement adaptatifs

Mots clés

Mots clés contrôlés

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Contribution à l'étude et au développement de modèles connexionnistes à apprentissage par renforcement : application à l'acquisition de comportement adaptatifs

Mots clés

Mots clés contrôlés

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses