Thèse soutenue

Multi-FedLS : un ordonnanceur d’applications d’apprentissage fédéré dans un environnement Multi-Cloud

FR  |  
EN
Auteur / Autrice : Rafaela Correia Brum
Direction : Pierre SensLùcia Maria A. DrummondLuciana Arantes
Type : Thèse de doctorat
Discipline(s) : Sciences et technologies de l'information et de la communication
Date : Soutenance le 29/11/2023
Etablissement(s) : Sorbonne université en cotutelle avec Universidade Federal Fluminense (Brésil)
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : LIP6 (1997-....)
Jury : Président / Présidente : Christophe Cérin
Examinateurs / Examinatrices : Pierre Sens, Cristina Boeres, Maria Clicia Stelling de Castro, Aline Marins Paes Carvalho
Rapporteur / Rapporteuse : Christophe Cérin, Guillaume Pierre

Résumé

FR  |  
EN

L'apprentissage fédéré (AF) est un nouveau domaine de l'apprentissage machine distribué où l'apprentissage garantit la confidentialité des données. Chaque client a accès uniquement à son propre ensemble de données local et privé. Cette approche est attrayante dans divers domaines du savoir car elle permet à différentes institutions de collaborer sans partager leurs données confidentielles. Comme la quantité de données requises pour la formation a considérablement augmenté ces dernières années, la plupart des institutions ne peuvent pas se permettre des centres de données physiques pour stocker et manipuler l'ensemble de leurs données. Une option viable consiste à utiliser des services de stockage en nuage proposés par des fournisseurs offrant différentes garanties de confidentialité et de disponibilité des données. L'utilisateur est responsable du choix des régions où ses données sont stockées et du contrôle de leur accès.De plus, les fournisseurs de services en nuage offrent divers services pour exécuter une application. Ils permettent aux utilisateurs de créer des machines virtuelles (MV) avec différentes configurations, où les utilisateurs ont un contrôle total sur celles-ci. Ce type de service est appelé Infrastructure en tant que Service (IaaS). Ainsi, un environnement multi-cloud est propice à la collaboration de différentes institutions dans la création d'un modèle d'apprentissage machine grâce à l'apprentissage fédéré.Dans cette thèse, nous proposons Multi-FedLS, un framework robuste conçu pour exécuter des applications AF dans un environnement multi-cloud. Le framework prend en compte l'emplacement actuel des ensembles de données de chaque client, le délai de communication et le coût d'utilisation dans les nuages, en se concentrant sur la réduction des coûts et du temps d'exécution. De plus, Multi-FedLS utilise des instances moins chères chaque fois que possible pour réduire les coûts, même si elles peuvent être révoquées à tout moment par le fournisseur de services en nuage. Ainsi, pour assurer l'exécution réussie des applications AF, le cadre utilise des techniques de tolérance aux pannes telles que les points de contrôle et la migration des tâches pour reprendre la formation sur une autre MV après une révocation. Multi-FedLS comprend quatre modules: Pre-Scheduling, Initial Maping, Fault Tolerance e Dynamic Scheduler. Les résultats obtenus démontrent la faisabilité de l'exécution d'applications dans des environnements multi-cloud en utilisant des MV peu coûteuses, en utilisant une formulation mathématique, des techniques de tolérance aux pannes et des heuristiques simples pour la sélection de nouvelles MV. Le framework a obtenu une réduction des coûts de 56,92% par rapport au temps d'exécution de l'application en utilisant des MV plus coûteuses, avec seulement une augmentation de 5,44% du temps d'exécution sur les fournisseurs de services en nuage commerciaux.