Performance des réseaux de neurones à spikes sur des données événementielles pour des applications automobiles embarquées
Auteur / Autrice : | Loïc Cordone |
Direction : | Benoît Miramond |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 16/12/2022 |
Etablissement(s) : | Université Côte d'Azur |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'électronique, antennes et télécommunications (Sophia Antipolis, Alpes-Maritimes) |
Jury : | Président / Présidente : Jean Martinet |
Examinateurs / Examinatrices : Benoît Miramond, Jean Martinet, Timothée Masquelier, Emre Neftci, Philippe Thierion, Lyes Khacef, Amos Sironi, Ryad Benosman | |
Rapporteurs / Rapporteuses : Timothée Masquelier, Emre Neftci |
Résumé
Aujourd'hui, les voitures embarquent de plus en plus d'algorithmes intelligents, appelés systèmes d'aides à la conduite (ADAS), qui cherchent à éviter l'apparition de situations dangereuses pouvant mener à des accidents. Ces algorithmes embarqués possèdent ainsi des contraintes très élevées en matière de latence, performance et consommation d'énergie. Les réseaux de neurones, vaguement inspirés par le fonctionnement des neurones biologiques, sont aujourd'hui les algorithmes d'intelligence artificielle les plus performants. Ils sont capables de répondre aux critères de latence et de performance demandés par les algorithmes embarqués automobiles, mais leur implémentation sur des architectures conventionnelles (CPU/GPU) résulte en une consommation énergétique élevée, accentuée par le fait qu'ils doivent tourner en permanence.Une solution à ce problème pourrait résider dans l'utilisation de réseaux de neurones à spikes (SNNs), un type de réseau de neurones plus biologiquement plausible où les couches communiquent entre elles uniquement par le biais d'impulsions électriques appelées spikes, asynchrones et binaires. Grâce à ce fonctionnement, les SNNs promettent une consommation d'énergie moins élevée sur des architectures hardware spécialisées dites neuromorphiques. Ces architectures sont composées d'unités de mémoire et d'unités de calcul parallélisées et distribuées, comme c'est le cas dans notre cerveau. Ainsi, les besoins en énergie sont moindres car ils n'ont qu'à traiter des valeurs binaires sparses.Un obstacle important à l'utilisation des SNNs pour traiter des problèmes de vision par ordinateur réside dans cette représentation de l'information sous forme de spikes. Une piste prometteuse pour représenter l'information visuelle sous forme de spikes est, encore une fois, de s'inspirer de la biologie. Un nouveau type de caméra, appelée caméra événementielle, capture l'information visuelle en utilisant des pixels photo-récepteurs détectant indépendamment les changements de luminosité. La sortie de ce type de caméra prend donc la forme d'événements, où chaque changement de luminosité est représenté par la position et le temps (à la microseconde près) où il s'est produit et une valeur binaire indiquant si le changement de luminosité est positif ou négatif. En pratique, les changements de luminosité représentent le mouvement des objets, ainsi la caméra ne sort des événements qu'aux endroits et aux moments où un mouvement s'est produit. Ces événements sont binaires et extrêmement sparses, ils peuvent donc être vus comme des spikes et représentent une entrée idéale pour les SNNs.Ainsi, nous étudions dans cette thèse la performance des réseaux de neurones à spikes pour le traitement de données événementielles, dans le but de construire des algorithmes intelligents qui soient performants, rapides et peu consommateurs d'énergie. Afin d'attaquer des problèmes de classification de données événementielles, nous avons développé de nouvelles méthodes d'apprentissage de SNNs basés sur des convolutions sparses et mis au point de nouvelles techniques qui permettent l'entraînement de SNNs très profonds (plus de 100 couches), atteignant des résultats à l'état de l'art en terme de précision et de sparsité. Nos résultats nous ont ensuite permis de traiter un problème plus pertinent pour des applications automobiles embarquées : la détection de voitures et de piétons sur des données événementielles, pour la première fois résolue avec des SNNs. Nous montrons aussi que les SNNs sont plus efficaces énergétiquement que des ANNs équivalents dans certaines conditions.Les contributions de cette thèse en termes d'entraînement de SNNs, de modèles de réseaux et de représentation des données événementielles permettent d'atteindre de nouveaux sommets en matière de performances, rendant un peu plus réaliste l'utilisation des SNNs et des caméras événementielles dans des applications automobiles embarquées réelles à faible consommation d'énergie.