Apprentissage par renforcement développemental

Matthieu Zimmer

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Apprentissage par renforcement développemental

FR |

EN

Auteur / Autrice :	Matthieu Zimmer
Direction :	Alain Dutech, Yann Boniface
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 15/01/2018
Etablissement(s) :	Université de Lorraine
Ecole(s) doctorale(s) :	École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine (1992-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire lorrain de recherche en informatique et ses applications
Jury :	Président / Présidente : Isabelle Debled-Rennesson
	Examinateurs / Examinatrices : Olivier Pietquin, Olivier Sigaud, Céline Teulière
	Rapporteur / Rapporteuse : Olivier Pietquin, Olivier Sigaud

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage profond

Réseaux neuronaux (informatique)

Apprentissage par renforcement (intelligence artificielle)

Mots clés libres

Apprentissage par renforcement

Acteur-critique

Réseaux de neurones

Environnement continu

Approche développementale

Apprentissage profond

Résumé

FR |

EN

L'apprentissage par renforcement permet à un agent d'apprendre un comportement qui n'a jamais été préalablement défini par l'homme. L'agent découvre l'environnement et les différentes conséquences de ses actions à travers des interactions avec celui-ci : il apprend de sa propre expérience, sans avoir de connaissances préétablies des buts ni des effets de ses actions. Cette thèse s'intéresse à la façon dont l'apprentissage profond peut aider l'apprentissage par renforcement à gérer des espaces continus et des environnements ayant de nombreux degrés de liberté dans l'optique de résoudre des problèmes plus proches de la réalité. En effet, les réseaux de neurones ont une bonne capacité de mise à l'échelle et un large pouvoir de représentation. Ils rendent possible l'approximation de fonctions sur un espace continu et permettent de s'inscrire dans une approche développementale nécessitant peu de connaissances a priori sur le domaine. Nous cherchons comment réduire l'expérience nécessaire à l'agent pour atteindre un comportement acceptable. Pour ce faire, nous avons proposé le cadre Neural Fitted Actor-Critic qui définit plusieurs algorithmes acteur-critique efficaces en données. Nous examinons par quels moyens l'agent peut exploiter pleinement les transitions générées par des comportements précédents en intégrant des données off-policy dans le cadre proposé. Finalement, nous étudions de quelle manière l'agent peut apprendre plus rapidement en tirant parti du développement de son corps, en particulier, en procédant par une augmentation progressive de la dimensionnalité de son espace sensorimoteur

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage par renforcement développemental

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage par renforcement développemental

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses