Recherche efficace d'architecture neuronale profonde via l'optimisation Bayésienne : Application à la vision par ordinateur
Auteur / Autrice : | Houssem Ouertatani |
Direction : | El-Ghazali Talbi, Smail Niar |
Type : | Projet de thèse |
Discipline(s) : | Informatique et applications |
Date : | Inscription en doctorat le 01/10/2021 |
Etablissement(s) : | Université de Lille (2022-....) |
Ecole(s) doctorale(s) : | MADIS Mathématiques, sciences du numérique et de leurs interactions |
Partenaire(s) de recherche : | Laboratoire : CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille |
Equipe de recherche : CRIStAL-INRIA |
Mots clés
Résumé
Les réseaux de neurones profonds ont permis des progrès significatifs dans de nombreuses applications, notamment la reconnaissance d'images et de la parole, la traduction automatique, la vision par ordinateur, etc. Les architectures des réseaux actuellement utilisées ont pour la plupart été développées manuellement par des experts humains, ce qui est un processus long et et susceptible d'entraîner des erreurs. Par conséquent, les méthodes de recherche automatisée des architectures, et l'optimisation des hyperparamètres suscitent un intérêt croissant. De plus, l'essor des DNNs continue d'être alimenté par les améliorations apportées aux accélérateurs matériels. L'objectif est le développement d'une méthodologie pour l'optimisation et la conception automatisée des réseaux profonds. La performance des modèles d'apprentissage profonds dépend fortement de l'architecture et du choix des hyperparamètres. Les défis scientifiques de ce projet peuvent être décrits par les difficultés suivantes : - La taille de l'espace de recherche: Les réseaux de neurones profonds sont difficiles à concevoir en raison du très grand nombre de paramètres à configurer. - Fonction objectif coûteuse: la fonction objectif du problème d'AutoDNN est très coûteuse à évaluer. L'optimisation bayésienne doit donc être appliquée. Elle consiste à utiliser des modèles de substitution (par exemple, des méta-modèles, des modèles réduits) tels que des processus gaussiens (par exemple, le krigeage) pour approximer la fonction objectif. - Optimisation multi-objectifs: La plupart des travaux sur l'AutoDNN formulent le problème comme un problème à objectif unique basé sur la précision. Les DNN donnent une grande précision au prix d'une complexité de calcul élevée (par exemple, des milliards de FLOPs). Récemment, les approches AutoDNN ont été appliquées à des applications nécessitant des modèles légers et un temps d'exécution rapide. Il peut être infaisable d'exécuter des applications en temps réel sur des plateformes à ressources limitées telles que l'IoT, les smartphones, les robots, les drones, les véhicules autonomes et les systèmes embarqués. En effet, ces plateformes sont souvent limitées par les ressources matérielles en termes de consommation d'énergie, de mémoire disponible, de FLOPs disponibles et de contraintes de latence. L'optimisation de ces objectifs multiples permettra un traitement efficace des DNN pour améliorer l'efficacité énergétique et le débit sans sacrifier la précision de l'application ou augmenter le coût du matériel. Il s'agit d'un aspect critique pour le déploiement à grande échelle des DNN dans les systèmes d'IA. En plus de la configuration des DNN, la configuration du matériel fera partie du problème d'optimisation multi-objectifs. De nombreux objectifs liés au matériel et non liés au matériel doivent être étudiés pour l'apprentissage et/ou l'inférence.