Traitements sécurisés de données compressées : application à l’apprentissage automatique et aux implants connectés
Auteur / Autrice : | Maxime Pistono |
Direction : | Gouenou Coatrieux, Jean-Claude Nunes |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 14/12/2021 |
Etablissement(s) : | Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de traitement de l’information médicale (Brest, Finistère) - Département lmage et Traitement Information |
Jury : | Président / Présidente : Maryline Laurent |
Examinateurs / Examinatrices : Gouenou Coatrieux, Jean-Claude Nunes, François Arnault, Fabrice Mériaudeau, Reda Bellafqira | |
Rapporteur / Rapporteuse : François Arnault, Fabrice Mériaudeau |
Mots clés
Résumé
Aujourd’hui les données sont de plus en plus externalisées et réutilisées que ce soit dans la santé ou de façon plus générale. L’intérêt de ces techniques est de réduire les coûts associés aux infrastructures informatiques, mais également de permettre un accès simplifié aux données tout en laissant la possibilité de les traiter grâce à des algorithmes de Big data. En effet, des algorithmes de machine learning appliqués sur ces données permettent d’aider le professionnel dans sa prise de décision. Il est néanmoins primordial de rappeler que les données personnelles donc en particulier celle appartenant au secteur de la santé sont des données sensibles. En conséquence de quoi, des réglementations nationales ou internationales imposent leur sécurisation. Cela passe par le fait d’assurer leur confidentialité au travers d’algorithmes de chiffrement ainsi que leur intégrité et traçabilité grâce au tatouage numérique. D’autre part, il est nécessaire de comprendre que les volumes de données utilisées sont très important. Ceci impose que les données et en particulier celle issues de l’imagerie sont compressées afin de réduire les coûts de stockage. C’est pourquoi dans cette thèse, nous nous intéresserons aux trois problématiques associées aux données que sont leur sécurisation, traitement et compression. L’objectif sera alors d’associer ces trois propriétés afin de fournir une solution globale permettant de traiter de façon sécurisée des données compressées. Au cours de ces trois années de thèse, nous avons commencé par nous intéresser aux algorithmes de sécurisation de données qui permettent de les traiter. Ces algorithmes plus connus sous le nom de cryptosystèmes homomorphes existent sous plusieurs formes. Le chiffrement additivement homomorphe permet un nombre limité de traitement, mais est relativement peu coûteuse. Le fully homomorphe augmente les possibilités de traitements au détriment des performances.Notre première solution propose d’allier un cryptosystème additivement homomorphe avec un système de concaténation qui permet une compression dans le domaine chiffré. Elle permet d’effectuer un traitement matriciel sécurisé des données. Cette solution s’inscrit dans le projet Followknee dans lequel l’objectif est de traiter de façon sécurisée des données issues d’une prothèse connectée sur un smartphone. Par la suite, nous avons entrepris d’observer l’influence de la compression sur la précision des modèles de machine learning. L’objectif de cette partie étant de voir s’il est possible de ne décompresser que partiellement des données et ainsi gagner en termes de coûts calculatoires avant de les utiliser dans de tels modèles. Suite à quoi,nous avons essayé de décompresser partiellement et de façon sécurisée des données grâce à des cryptosystèmes fully homomorphes. Ceci représente la première étape d’une chaîne de traitement plus complexe permettant de compresser des données puis de les chiffrer avant de les externaliser vers un cloud.Une fois externalisées, ces données pourront être partiellement décompressées afin d’être utilisées de façon sécurisée au travers d’algorithmes de traitement. Pour finir, nous avons étudié la possibilité d’utiliser un cryptosystème additivement homomorphe en combinaison de calcul multipartite afin de sécuriser l’apprentissage d’un réseau de neurones artificiels.