Thèse soutenue

DISSEC-ML ˸ vers un apprentissage automatique distribué et sécurisé dans le cloud personnel

FR  |  
EN
Auteur / Autrice : Julien Mirval
Direction : Iulian Sandu PopaLuc BouganimPaul Tran Van
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 11/03/2024
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Données et algorithmes pour une ville intelligente et durable (Versailles ; 2015-...) - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Saclay, Ile-de-France)
Référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….)
Entreprise : Cozy Cloud
Equipe de recherche : PETRUS - PErsonal TRUSted cloud
Jury : Président / Présidente : Gaël Thomas
Examinateurs / Examinatrices : Patricia Serrano Alvarado, David Gross-Amblard, Sonia Ben Mokhtar
Rapporteur / Rapporteuse : Patricia Serrano Alvarado, David Gross-Amblard

Résumé

FR  |  
EN

Les initiatives comme le Blue Button et les nouvelles réglementations comme le RGPD européen visent à permettre aux individus de récupérer leurs données personnelles auprès des entreprises ou des organismes qui les ont recueillies. Parallèlement, des plateformes, qu'on appelle Personal Data Management System (PDMS), Personal Information Management System (PIMS) ou Cloud Personnel se développent rapidement et permettent aux utilisateurs de regrouper tout leur patrimoine numérique. Le paradigme PDMS promet d'ouvrir la voie à de nouveaux usages innovants développés autour des données personnelles, et de réaliser notamment des calculs distribués sur un grand nombre de PDMS (e.g., classification automatique, recommandations, études participatives). De tels exemples nécessitent souvent la formation d'un modèle d'intelligence artificielle (IA) basé sur un grand volume de données des utilisateurs, soulevant également d'importants défis au niveau de la protection de la vie privée et de la performance d'un tel calcul. Ainsi, l'organisation d'un calcul distribué sécurisé et efficace entre un grand nombre de PDMS peut s'avérer complexe, surtout en présence d'un nombre potentiellement important de nœuds corrompus. Cette thèse CIFRE est réalisée avec la société Cozy Cloud qui propose une solution libre de cloud personnel, Cozy. L'objectif est de fournir une étude approfondie de ce problème nouveau et crucial et de proposer des solutions appropriées pour entraîner efficacement un modèle d'IA (e.g., un réseau neuronal profond) dans un système totalement distribué tout en offrant de solides garanties de sécurité aux nœuds participants. Les résultats, sous forme de protocoles et d'algorithmes d'exécution distribués, sécurisés et fiables seront appliqués à des cas pratiques fournis par la société Cozy Cloud.