Codages optimisés pour la conception d'accélérateurs matériels de réseaux de neurones profonds
| Auteur / Autrice : | Clément Metz |
| Direction : | Antoine Dupret, Olivier Bichler |
| Type : | Thèse de doctorat |
| Discipline(s) : | Sciences de l'information et de la communication |
| Date : | Soutenance le 18/12/2023 |
| Etablissement(s) : | université Paris-Saclay |
| Ecole(s) doctorale(s) : | École doctorale Electrical, optical, bio : physics and engineering (Orsay, Essonne ; 2015-....) |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire d'intégration des systèmes et des technologies (Gif-sur-Yvette, Essonne ; 2001-....) |
| Référent : Université Paris-Saclay. Faculté des sciences d’Orsay (Essonne ; 2020-....) | |
| graduate school : Université Paris-Saclay. Graduate School Sciences de l’ingénierie et des systèmes (2020-….) | |
| Jury : | Président / Présidente : Sylvie Le Hégarat |
| Examinateurs / Examinatrices : Eva Dokladalova, Frédéric Pétrot, Maxime Pelcat | |
| Rapporteurs / Rapporteuses : Eva Dokladalova, Frédéric Pétrot | |
| DOI : | 10.70675/d67a3099z75d9z46e3zb019ze5d773b57ee5 |
Résumé
Par leurs domaines d'application très divers (santé, énergie, défense, finance, navigation autonome...), les réseaux de neurones constituent une composante importante des outils d'apprentissage automatique. Les performances des réseaux de neurones sont grandement influencées par la complexité de leur architecture en nombre de couches, de neurones et de connexions. Mais l'entraînement et l'inférence de réseaux de plus en plus grands implique une sollicitation croissante de ressources matérielles et des temps de calcul plus longs. A l'inverse, leur portabilité se retrouve bridée sur des systèmes embarqués aux faibles capacités mémoire et/ou calculatoire.L'objectif de cette thèse est d'étudier et de concevoir des méthodes permettant de réduire l'empreinte matérielle des réseaux de neurones tout en préservant au mieux leurs performances. Nous nous restreignons aux réseaux de convolution dédiés à la vision par ordinateur en étudiant les possibilités offertes par la quantification. La quantification vise à réduire l'empreinte matérielle des réseaux en mémoire, en bande passante et en opérateurs de calculs par la réduction du nombre de bits des paramètres et des activations.Les contributions de cette thèse consistent en une nouvelle méthode de quantification post-entraînement reposant sur l'exploitation des corrélations spatiales des paramètres du réseau, une approche facilitant l'apprentissage des réseaux très fortement quantifiés, ainsi qu'une méthode visant à combiner la quantification en précision mixte et le codage entropique sans perte.Cette thèse se limite essentiellement aux aspects algorithmiques, mais les orientations de recherche ont été fortement influencées par la contrainte de faisabilité matérielle des propositions apportées.