Thèse soutenue

Calcul neuromorphique basé sur la physique : des neurones à impulsions aux algorithmes d'apprentissage

FR  |  
EN
Auteur / Autrice : Marie Drouhin
Direction : Damien QuerliozJulie Grollier
Type : Thèse de doctorat
Discipline(s) : Electronique, Photonique et Micro-Nanotechnologies
Date : Soutenance le 22/11/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Electrical, optical, bio : physics and engineering (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Centre de nanosciences et de nanotechnologies (Palaiseau, Essonne ; 2016-....) - Laboratoire Albert Fert (Palaiseau, Essonne ; 1995-....)
Référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Sciences de l’ingénierie et des systèmes (2020-….)
Jury : Président / Présidente : Laurent Cario
Examinateurs / Examinatrices : Daniel Brunner, Marc Bocquet, Adrien F. Vincent
Rapporteur / Rapporteuse : Laurent Cario, Daniel Brunner

Résumé

FR  |  
EN

À l'ère numérique actuelle, caractérisée par une augmentation exponentielle de la puissance de calcul et de la capacité de mémoire, nous sommes confrontés à un défi pressant : la consommation d'énergie croissante de la technologie de l'information. La demande croissante de services intensifs en données, notamment l'intelligence artificielle (IA) et le cloud computing, souligne la nécessité de calculs respectueux de l'environnement et propices à l'innovation. Cette thèse explore le potentiel des memristors pour le calcul neuromorphique afin de réaliser une IA basse énergie. Nous avons d'abord étudié des neurones composés de memristors volatils NbOx, offrant une alternative attrayante aux dispositifs CMOS classiques par leur scalabilité et leur dynamique. Ces dispositifs ont été caractérisés et présentent de nombreux comportements avec impulsions et bursting, tels que l'intégration et tir avec fuite ou le « phasic bursting ». Nous avons modélisé ces comportements à l'aide de dynamique non linéaire. En particulier, l'origine du « phasic bursting » a pu être élucidée : elle émerge d'une bifurcation de Hopf entre les régimes de cycle limite et de point fixe. Ce modèle peut s'avérer utile lors de la conception de puces neuromorphiques à impulsions. Du côté des algorithmes, nous avons adapté la Propagation à l'Équilibre (EqProp) aux systèmes physiques. EqProp, ancré dans la physique plutôt que dans le calcul, offre une perspective intéressante: exploiter la physique inhérente des systèmes réels pour l'apprentissage sur puce. Ce travail a porté sur l'adaptation des gradients continus aux memristors, où la programmation se fait sous forme d'impulsions. Pour cela, nous avons exploré diverses approches de discrétisation des gradients. La première méthode, la discrétisation ternaire, a démontré des taux de précision comparables à ceux de EqProp. Dans ce contexte, nous avons examiné le rôle des hyperparamètres et leur influence sur les performances du réseau. Nous avons ensuite introduit des mise-à-jours probabilistes, ce qui a amélioré les performances et a permis d'obtenir une distribution de mises-à-jours similaire au cas non discrétisé. Une autre approche avec davantage d'états quantifiés a été étudiée. Bien que cette dernière approche surpasse l'approche ternaire non probabiliste en termes de performances, elle a aussi des désavantages - une distribution plus large des impulsions et une consommation d'énergie plus élevée que l'approche ternaire probabiliste. Nous avons ensuite testé la résilience de la version discrétisée de EqProp en remplaçant les synapses idéales par des mesures de memristors HfOx. À cette fin, nous avons utilisé une plateforme où les memristors étaient accessibles individuellement. Nous avons d'abord effectué des simulations de contrôle : un perceptron à une seule couche et un réseau à deux couches avec première couche gelée. Ces expériences ont donné un aperçu du potentiel des synapses memristives, avec des précisions atteignant 78,1 % et 70,8 %, respectivement. Ensuite, nous avons étudié un réseau à une couche cachée. Deux définitions de poids ont été utilisées - les différences linéaire et logarithmique des conductances. La définition linéaire s'est avérée être la meilleure, avec une précision de 91% comparé à 89,5 % obtenu par la version logarithmique. Pour améliorer ces résultats, nous avons limité la valeur de la conductance au-dessus d'un seuil afin d'atténuer l'effet du régime bruité et non linéaire des memristors. Ainsi, les définitions linéaires et logarithmiques des poids ont respectivement atteint des précisions de 91,75 % et 92,14 %. Ces résultats constituent une étape importante pour la mise en œuvre pratique de l'apprentissage sur puce. En résumé, cette thèse explore le potentiel des memristors pour le calcul neuromorphique afin de réaliser une IA basse énergie. Ce domaine promet des avancées innovantes à l'intersection de la physique et de l'IA, offrant au calcul un futur plus durable et puissant.