Attribution de crédit pour l'apprentissage par renforcement dans des réseaux profonds

Thomas Mesnard

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Thomas Mesnard
Direction :	Éric Moulines, Rémi Munos
Type :	Thèse de doctorat
Discipline(s) :	Mathématiques et informatique
Date :	Soutenance le 21/12/2023
Etablissement(s) :	Institut polytechnique de Paris
Ecole(s) doctorale(s) :	École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche :	Laboratoire : Centre de mathématiques appliquées (Palaiseau, Essonne) - Centre de Mathématiques Appliquées - Ecole Polytechnique / CMAP
Jury :	Président / Présidente : Aurélien Garivier
	Examinateurs / Examinatrices : Éric Moulines, Rémi Munos, Timothy Lillicrap, Doina Precup, Alessandro Lazaric
	Rapporteurs / Rapporteuses : Aurélien Garivier, Timothy Lillicrap

Mots clés

FR |

EN

Mots clés contrôlés

Intelligence artificielle

Apprentissage par renforcement (intelligence artificielle)

Mots clés libres

Apprentissage par renforcement

Attribution de crédit

Raisonnement

Résumé

FR |

EN

L'apprentissage profond par renforcement a été au cœur de nombreux résultats révolutionnaires en intelligence artificielle ces dernières années. Ces agents reposent sur des techniques d'attribution de crédit qui cherchent à établir des corrélations entre actions passées et événements futurs et utilisent ces corrélations pour devenir performants à une tâche. Ce problème est au cœur des limites actuelles de l'apprentissage par renforcement et les techniques d'attribution de crédit utilisées sont encore relativement rudimentaires et incapables de raisonnement inductif. Cette thèse se concentre donc sur l'étude et la formulation de nouvelles méthodes d'attributions de crédit dans le cadre de l'apprentissage par renforcement. De telles techniques pourraient permettre d'accélérer l'apprentissage, de mieux généraliser lorsqu'un agent est entraîné sur de multiples tâches, et peut-être même permettre l'émergence d'abstraction et de raisonnement.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Attribution de crédit pour l'apprentissage par renforcement dans des réseaux profonds

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Attribution de crédit pour l'apprentissage par renforcement dans des réseaux profonds

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses