DISSEC-ML ˸ vers un apprentissage automatique distribué et sécurisé dans le cloud personnel
Mots clés
Résumé
Les initiatives comme le Blue Button et les nouvelles réglementations comme le RGPD européen visent à permettre aux individus de récupérer leurs données personnelles auprès des entreprises ou des organismes qui les ont recueillies. Parallèlement, des plateformes, qu'on appelle Personal Data Management System (PDMS), Personal Information Management System (PIMS) ou Cloud Personnel se développent rapidement et permettent aux utilisateurs de regrouper tout leur patrimoine numérique. Le paradigme PDMS promet d'ouvrir la voie à de nouveaux usages innovants développés autour des données personnelles, et de réaliser notamment des calculs distribués sur un grand nombre de PDMS (e.g., classification automatique, recommandations, études participatives). De tels exemples nécessitent souvent la formation d'un modèle d'intelligence artificielle (IA) basé sur un grand volume de données des utilisateurs, soulevant également d'importants défis au niveau de la protection de la vie privée et de la performance d'un tel calcul. Ainsi, l'organisation d'un calcul distribué sécurisé et efficace entre un grand nombre de PDMS peut s'avérer complexe, surtout en présence d'un nombre potentiellement important de nœuds corrompus. Cette thèse CIFRE est réalisée avec la société Cozy Cloud qui propose une solution libre de cloud personnel, Cozy. L'objectif est de fournir une étude approfondie de ce problème nouveau et crucial et de proposer des solutions appropriées pour entraîner efficacement un modèle d'IA (e.g., un réseau neuronal profond) dans un système totalement distribué tout en offrant de solides garanties de sécurité aux nœuds participants. Les résultats, sous forme de protocoles et d'algorithmes d'exécution distribués, sécurisés et fiables seront appliqués à des cas pratiques fournis par la société Cozy Cloud.