Autour De L'Usage des gradients en apprentissage statistique

Pierre-Yves Massé

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Autour De L'Usage des gradients en apprentissage statistique

FR |

EN

Auteur / Autrice :	Pierre-Yves Massé
Direction :	Yann Ollivier
Type :	Thèse de doctorat
Discipline(s) :	Mathématiques et Informatique
Date :	Soutenance le 14/12/2017
Etablissement(s) :	Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche :	établissement opérateur d'inscription : Université Paris-Sud (1970-2019)
	Laboratoire : Laboratoire de recherche en informatique (Orsay, Essonne ; 1998-2020)
Jury :	Président / Présidente : Éric Moulines
	Examinateurs / Examinatrices : Yann Ollivier, Éric Moulines, Sébastien Bubeck, Emmanuel Trélat
	Rapporteurs / Rapporteuses : Sébastien Bubeck, Emmanuel Trélat

Mots clés

FR |

EN

Mots clés contrôlés

Réseaux neuronaux (informatique)

Algorithmes bio-inspirés (intelligence artificielle)

Systèmes dynamiques

Approximation stochastique

Optimisation mathématique

Apprentissage automatique

Mots clés libres

Apprentissage statistique

Optimisation stochastique

Systèmes dynamiques

Résumé

FR |

EN

Nous établissons un théorème de convergence locale de l'algorithme classique d'optimisation de système dynamique RTRL, appliqué à un système non linéaire. L'algorithme RTRL est un algorithme en ligne, mais il doit maintenir une grande quantités d'informations, ce qui le rend impropre à entraîner des systèmes d'apprentissage de taille moyenne. L'algorithme NBT y remédie en maintenant une approximation aléatoire non biaisée de faible taille de ces informations. Nous prouvons également la convergence avec probabilité arbitrairement proche de un, de celui-ci vers l'optimum local atteint par l'algorithme RTRL. Nous formalisons également l'algorithme LLR et en effectuons une étude expérimentale, sur des données synthétiques. Cet algorithme met à jour de manière adaptive le pas d'une descente de gradient, par descente de gradient sur celui-ci. Il apporte ainsi une réponse partielle au problème de la fixation numérique du pas de descente, dont le choix influence fortement la procédure de descente et qui doit sinon faire l'objet d'une recherche empirique potentiellement longue par le praticien.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Autour De L'Usage des gradients en apprentissage statistique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Autour De L'Usage des gradients en apprentissage statistique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses