Intégration des Processus d’Apprentissage Profond sur des Plateformes Hétérogènes Embarquées GPU/FPGA
Auteur / Autrice : | Walther Carballo Hernandez |
Direction : | François Berry, Maxime Pelcat |
Type : | Thèse de doctorat |
Discipline(s) : | Electronique et Systèmes |
Date : | Soutenance le 18/11/2022 |
Etablissement(s) : | Université Clermont Auvergne (2021-...) |
Ecole(s) doctorale(s) : | École doctorale des sciences pour l'ingénieur (Clermont-Ferrand) |
Partenaire(s) de recherche : | Laboratoire : Institut Pascal (Aubière, Puy-de-Dôme) |
Jury : | Examinateurs / Examinatrices : Miguel Octavio Arias Estrada, Ricardo Carmona-Galán, Patrick Girard, Paula Lopez Martinez |
Rapporteurs / Rapporteuses : Philippe Coussy, Alfredo Gardel Vicente |
Mots clés
Résumé
Le déploiement d’algorithmes tel que l’inférence de réseaux de neurones convolutifs, impose des temps d’exécution courts et une consommation électrique maîtrisée sur des systèmes embarqués disposant de ressources de calculs limitées. De nouvelles électroniques spécifiques composées de différentes architectures matérielles ont émergé pour répondre à ce type de demande. Ce type d’architecture hétérogène impose de nouveaux défis notamment au niveau de l’interaction entre les différentes composantes. Il est alors nécessaire de passer par une étape de co-design matérielle/logicielle décrivant au mieux la plateforme électronique afin d’atteindre un optimum en termes de consommation, latence et vitesse d’exécution.Pour éviter une conception agnostique du matériel, la littérature de l’état de l’art incorpore des modèles en profilant la performance. Celle-ci, dans l’intention d’aider avec la sélection des partitions sur chaque accélérateur. En suite, des techniques d’optimisation mathématique profitent de ces résultats pour améliorer encore la distribution des tâches de travail spécifiquement adaptées à la plateforme. Cette thèse cible d’assister le développeur en étudiant le modelage, partitionnement et optimisation pour les plateformes embarquées hétérogènes dans le contexte des modèles de calcul des CNNs. Le cadre de ce manuscrit couvre principalement des topologies en couplant des accélérateurs GPU et FPGA dans des systèmes hybrides. En se concentrant de cette manière, sur les opportunités et limitations de l’intégration d’architecturelle : logique programmable customisable et SIMD.