Thèse en cours

DISSEC-ML : vers un apprentissage automatique distribué et sécurisé dans le cloud personnel

FR  |  
EN

Accès à la thèse

Triangle exclamation pleinLa soutenance a eu lieu en 2024. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Julien Mirval
Direction : Iulian Sandu Popa
Type : Projet de thèse
Discipline(s) : Informatique
Date : Soutenance en 2024
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Données Algorithmes pour une ville intelligente et durable
Equipe de recherche : PETRUS - PErsonal TRUSted cloud
référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Gaël Thomas
Examinateurs / Examinatrices : Patricia Serrano-alvarado, Sonia Ben mokhtar, David Gross-amblard
Rapporteurs / Rapporteuses : Patricia Serrano-alvarado, David Gross-amblard

Résumé

FR  |  
EN

Les initiatives comme le Blue Button et les nouvelles réglementations comme le RGPD européen visent à permettre aux individus de récupérer leurs données personnelles auprès des entreprises ou des organismes qui les ont recueillies. Parallèlement, des plateformes, qu'on appelle Personal Data Management System (PDMS), Personal Information Management System (PIMS) ou Cloud Personnel se développent rapidement et permettent aux utilisateurs de regrouper tout leur patrimoine numérique. Le paradigme PDMS promet d'ouvrir la voie à de nouveaux usages innovants développés autour des données personnelles, et de réaliser notamment des calculs distribués sur un grand nombre de PDMS (e.g., classification automatique, recommandations, études participatives). De tels exemples nécessitent souvent la formation d'un modèle d'intelligence artificielle (IA) basé sur un grand volume de données des utilisateurs, soulevant également d'importants défis au niveau de la protection de la vie privée et de la performance d'un tel calcul. Ainsi, l'organisation d'un calcul distribué sécurisé et efficace entre un grand nombre de PDMS peut s'avérer complexe, surtout en présence d'un nombre potentiellement important de nœuds corrompus. Cette thèse CIFRE est réalisée avec la société Cozy Cloud qui propose une solution libre de cloud personnel, Cozy. L'objectif est de fournir une étude approfondie de ce problème nouveau et crucial et de proposer des solutions appropriées pour entraîner efficacement un modèle d'IA (e.g., un réseau neuronal profond) dans un système totalement distribué tout en offrant de solides garanties de sécurité aux nœuds participants. Les résultats, sous forme de protocoles et d'algorithmes d'exécution distribués, sécurisés et fiables seront appliqués à des cas pratiques fournis par la société Cozy Cloud.