Thèse en cours

Hétérogénéité des Clients dans les Systèmes d'Apprentissage Fédérés

FR  |  
EN
Auteur / Autrice : Angelo Rodio
Direction : Giovanni NegliaAlain Jean-marie
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/04/2021
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche : Laboratoire : Ingénierie et Opérations des Réseaux

Résumé

FR  |  
EN

L'apprentissage fédéré (FL) est un cadre collaboratif où les clients (dispositifs mobiles) entraînent un modèle d'apprentissage machine sous la coordination d'un serveur central en préservant la décentralisation des données. L'hétérogénéité de la participation des clients provient de la diversité des capacités des appareils en termes de spécifications matérielles, de types de connectivité réseau et de disponibilité énergétique. Cette thèse se concentre sur l'analyse de l'impact de cette hétérogénéité sur la convergence des algorithmes d'apprentissage fédéré et propose des algorithmes pratiques pour une utilisation plus efficace des systèmes et des ressources. La première partie aborde les défis liés à la corrélation temporelle et spatiale dans la participation des clients. Nous montrons que la participation hétérogène peut biaiser l'apprentissage et formalisons ce biais-variance induit par cette hétérogénéité. Notre étude démontre que donner plus de poids aux clients qui participent fréquemment peut accélérer la convergence. De plus, nous examinons l'impact de la corrélation à travers un modèle de chaîne de Markov à états finis, révélant que la corrélation ralentit la convergence. Notre approche propose une optimisation de ce compromis biais-variance à travers l'algorithme Correlation-Aware Federated Learning (CA-Fed), qui favorise une convergence plus rapide. La deuxième partie traite des scénarios de communication défectueuse. Les conditions réseau, notamment les pertes de paquets, introduisent une hétérogénéité incontrôlable dans la participation des clients. Contrairement aux stratégies traditionnelles qui compensent les pertes de paquets, notre solution permet aux algorithmes d'apprentissage fédéré de fonctionner efficacement même dans des canaux asymétriques et défaillants en adaptant la transmission des mises à jour des modèles. Les tests montrent que notre algorithme atteint des performances comparables à celles obtenues dans des conditions idéales, sans pertes de paquets. Enfin, la troisième partie explore l'utilisation de méthodes de réduction de variance pour compenser l'hétérogénéité dans la participation des clients. Bien que des stratégies similaires aient été envisagées pour atténuer l'impact de la participation partielle des clients, notre analyse élargit ce cadre à une participation client hétérogène. Nous démontrons que la convergence est significativement influencée par les clients participant le moins, suggérant que les algorithmes existants ne sont pas optimisés pour de tels environnements. Notre méthode, FedStale, utilise efficacement les mises à jour obsolètes dans des contextes de participation hétérogène.