Thèse soutenue

Optimisation d'hyperparamètres de modèles d'apprentissage profond

FR  |  
EN
Auteur / Autrice : Guillaume Lacharme
Direction : Hubert CardotChristophe LenteNicolas Monmarché
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 24/05/2024
Etablissement(s) : Tours
Ecole(s) doctorale(s) : Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...)
Jury : Président / Présidente : Clarisse Dhaenens
Examinateurs / Examinatrices : Axel Parmentier
Rapporteurs / Rapporteuses : Karteek Alahari, Akka Zemmari
DOI : 10.70675/636f153aza334z4c1az84cazcf593f5204e6

Résumé

FR  |  
EN

Les modèles d'apprentissage profond ont permis de grandes percées dans de nombreux domaines tels que le traitement de texte, d'image et du son. Ils se distinguent des autres modèles grâce à leurs grandes capacités de représentation automatique.Ces modèles reposent sur de nombreux hyperparamètres. Il convient de bien les sélectionner car ces derniers influent sur le nombre de degrés de liberté du modèle ainsi que sur son processus d'apprentissage. Ils ont un impact direct sur la capacité de généralisation du modèle. Nous savons grâce aux nombreuses expérimentations que les modèles très profonds ont tendance à mieux généraliser. Les méthodes classiques d'optimisation d'hyperparamètres sont difficilement applicables pour ce type de modèle car le coût d'évaluation d'un hyperparamètre est trop élevé. De nombreuses approches ont cherché à réduire ce coût d'évaluation.Dans cette thèse, nous avons choisi de nous focaliser sur l'optimisation des hyperparamètres associés aux réseaux de neurones convolutifs. Ces types de réseaux sont très utilisés pour les problèmes de reconnaissance de forme.Nous nous pencherons dans un premier temps sur les hyperparamètres attachés à la topologie de ces réseaux. Puis nous nous intéresserons aux hyperparamètres impactant leur processus d'apprentissage.