Thèse en cours

Compression de données pour circuits d'accélération matérielle hautes performances

FR  |  
EN
Auteur / Autrice : Olivier Romane
Direction : Frédéric Petrot
Type : Projet de thèse
Discipline(s) : Mathématiques et Informatique
Date : Inscription en doctorat le 04/03/2024
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Techniques de l'Informatique et de la Microélectronique pour l'Architecture des systèmes intégrés
Equipe de recherche : SLS - System Level Synthesis (Olivier MULLER)

Résumé

FR  |  
EN

Les réseaux de neurones consistent le plus souvent à effectuer un grand nombre de multiplications matrice-vecteur et matrice-matrice. La conception de circuits d'accélération matérielle pour les réseaux de neurones s'intéresse donc principalement à l'accélération de ces opérations matricielles. Les matrices considérées sont souvent de grande taille, chacune avec des millions voire dizaines de millions de paramètres. La taille des mémoires de paramètres et la bande passante effectivement disponible avec les unités de calcul sont des paramètres de conception de première importance. Il a déjà été proposé de compresser les paramètres en mémoire afin de réduire les besoins en taille de mémoire et en bande passante. Cela exploite généralement la proportion de paramètres nuls (sparsité) dans le contenu des matrices de paramètres. L'inconvénient est que des opérations de décompressions doivent nécessairement être effectuées sur le flux de données qui alimente les cœurs de calcul. Et les méthodes de compression qui présentent un facteur de compression élevé impliquent des opérations fortement séquentielles et un flot de contrôle complexe. Les performances du circuit accélérateur global deviennent limitées par la vitesse à laquelle les flux de données peuvent effectivement être décompressés. D'autres directions ont été étudiées, avec pour objectif premier de maintenir les débits de données à des valeurs élevées, mais au prix de taux de compression plus faibles. Des travaux précédents ont étudié la compression des valeurs ternaires, mais d'autres types de quantification sont envisagées. De plus, les réseaux de neurones sont de façon inhérente résilients à de légères erreurs de calcul. Cette propriété pourrait être exploitée afin de concevoir des types de compression avec de meilleurs taux de compression. L'objectif du doctorat est de concevoir des techniques de compression/décompression de faible complexité et qui affectent le moins possible les performances de transferts de données.