Apprentissage fédéré personnalisé pour la reconnaissance de l'activité humaine à partir de capteurs dans des environnements pervasifs hétérogènes
| Auteur / Autrice : | Sannara Ek |
| Direction : | Philippe Lalanda, François Portet |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance le 26/11/2024 |
| Etablissement(s) : | Université Grenoble Alpes |
| Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble, Isère, France ; 1995-....) |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique de Grenoble (Isère, France ; 2007-....) |
| Equipe de recherche : Groupe d'étude en traduction automatique - Traitement automatisé des langues et de la parole (Grenoble ; 2007-....) | |
| Jury : | Président / Présidente : Vania Marangozova |
| Examinateurs / Examinatrices : Giovanni Neglia, Keiichi Yasumoto | |
| Rapporteurs / Rapporteuses : Jiannong Cao, Cecilia Mascolo |
Mots clés
Résumé
Les avancées récentes dans la technologie des capteurs et l'informatique mobile ont considérablement amélioré les applications de l'informatique omniprésente, intégrant des dispositifs intelligents dans nos environnements pour offrir une gamme variée de services orientés vers l'utilisateur. Ces services sont renforcés par les modèles d'apprentissage automatique (ML), de plus en plus intégrés à ces dispositifs pour exploiter leur puissance de calcul et les données abondantes disponibles. Cependant, adapter le ML à un paradigme centré sur l'utilisateur — où la priorité est que les modèles locaux soient bien personnalisés et généralisés tout en garantissant la confidentialité des données — présente des défis. L'apprentissage fédéré (FL), un cadre client-serveur de méta-apprentissage, offre une solution prometteuse en évitant la nécessité de communiquer les données des utilisateurs. Traditionnellement centré sur le serveur, optimisant un modèle global unique et généralisé, le FL tire parti des capacités de calcul des dispositifs locaux et de leurs données pour l'entraînement. Cependant, pour répondre pleinement aux besoins de l'informatique omniprésente, un passage vers un paradigme centré sur le client est essentiel.Cette thèse explore l'application et les défis du FL centré sur le client dans le domaine basé sur les capteurs de la reconnaissance d'activités humaines (HAR), qui consiste à prédire les mouvements physiques à partir de dispositifs mobiles tels que les smartphones et les montres intelligentes. Nous explorons les avantages et les limitations de cette approche en concevant plusieurs nouvelles évaluations qui mettent en évidence les effets néfastes de l'hétérogénéité entre les dispositifs des clients. De plus, nous proposons des contributions nécessaires pour atténuer ces effets, visant à améliorer la performance globale et la fiabilité du FL centré sur le client dans les applications HAR.Pour répondre à la limitation de l'hétérogénéité, nous présentons une technique d'agrégation FL novatrice qui ajuste dynamiquement l'architecture du modèle pour s'adapter aux caractéristiques uniques de chaque client. Ensuite, nous adoptons des architectures HAR légères basées sur des transformers, robustes aux environnements changeants et aux habitudes des utilisateurs. De plus, nous développons un pipeline de pré-entraînement novateur utilisant plusieurs ensembles de données publiques pour réduire les besoins en données pour le réglage local. Par la suite, nous explorons trois catégories de techniques d'apprentissage auto-supervisé pour améliorer encore la robustesse des modèles clients en exploitant des données non étiquetées. Enfin, nous introduisons un mécanisme de correspondance d'embeddings à prototypes via un plan de transport optimal pour régulariser les clients au sein du cadre FL, en renforçant la similarité des poids et en promouvant la cohérence des modèles.