Traitements sécurisés de données compressées : application à l’apprentissage automatique et aux implants connectés - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Secure compressed data processing : Application to machine learning and connected implants

Traitements sécurisés de données compressées : application à l’apprentissage automatique et aux implants connectés

Résumé

Nowadays, medical data and data in general are more and more outsourced to the cloud. The purpose of outsourcing is to reduce the costs associated with operations of an IT structure. Moreover, it allows reusing data and big data analysis. More precisely, different professional can access data remotely, which simplifies information sharing. Furthermore, machine learning algorithms can process outsourced data in order to help professionals in their decision-making. However, these data are personal and sensitive, which is particularly true for medical one. According to this fact, data have to be acquired, transmitted and processed in a secure way. To do so, national and international laws regulate their uses. Hence, data confidentiality, integrity and traceability have to be ensured using encryption and watermarking. In addition, the processed datasize is significant. This is why they are generally compressed in order to reduce storage and communication cost. This is especially true regarding medical images. That is the reason why through this thesis we were interested in data: security, compression and processing. The objective is to associate these three properties in a method allowing to securely process compressed data. During these three years of thesis, we started by focusing on algorithms that allow to securely process data. These algorithms are known as homomorphic encryption. For example, additively homomorphic cryptosystems only allow to secure the addition operation, while fully homomorphic cryptosystems allow to securely evaluate bots addition and multiplication. However, fully homomorphic cryptosystems are computationally more expensive than additively homomorphic cryptosystems. Our first solution jointly uses an additively homomorphic cryptosystem, a lightweight cryptosystem and a compression into the encrypted domain. This solution allows to securely process matrix data. It was developed for the Followknee project, whose objective is to securely process data issued froma prosthesis on a smartphone. Next, we were interested in analyzing the influence of feeding machine learning model with compressed or partially compressed data. The objective was to know if it is possible or not to only partially decompress data and thus reduce calculation costs before feeding machine learning model. There after, we try to securely decompress data using fully homomorphic cryptosystems. This constitutes the first step of a more complex processing chain. This chain aims to compress data before outsourcing them to a cloud. Once data are on the cloud, they can be partially decompressed in order to feed machine learning algorithm. Finally, we proposed a way to combine multi-party computation with additively homomorphic cryptosystems aiming to secure the artificial neural network training and inference.
Aujourd’hui les données sont de plus en plus externalisées et réutilisées que ce soit dans la santé ou de façon plus générale. L’intérêt de ces techniques est de réduire les coûts associés aux infrastructures informatiques, mais également de permettre un accès simplifié aux données tout en laissant la possibilité de les traiter grâce à des algorithmes de Big data. En effet, des algorithmes de machine learning appliqués sur ces données permettent d’aider le professionnel dans sa prise de décision. Il est néanmoins primordial de rappeler que les données personnelles donc en particulier celle appartenant au secteur de la santé sont des données sensibles. En conséquence de quoi, des réglementations nationales ou internationales imposent leur sécurisation. Cela passe par le fait d’assurer leur confidentialité au travers d’algorithmes de chiffrement ainsi que leur intégrité et traçabilité grâce au tatouage numérique. D’autre part, il est nécessaire de comprendre que les volumes de données utilisées sont très important. Ceci impose que les données et en particulier celle issues de l’imagerie sont compressées afin de réduire les coûts de stockage. C’est pourquoi dans cette thèse, nous nous intéresserons aux trois problématiques associées aux données que sont leur sécurisation, traitement et compression. L’objectif sera alors d’associer ces trois propriétés afin de fournir une solution globale permettant de traiter de façon sécurisée des données compressées. Au cours de ces trois années de thèse, nous avons commencé par nous intéresser aux algorithmes de sécurisation de données qui permettent de les traiter. Ces algorithmes plus connus sous le nom de cryptosystèmes homomorphes existent sous plusieurs formes. Le chiffrement additivement homomorphe permet un nombre limité de traitement, mais est relativement peu coûteuse. Le fully homomorphe augmente les possibilités de traitements au détriment des performances.Notre première solution propose d’allier un cryptosystème additivement homomorphe avec un système de concaténation qui permet une compression dans le domaine chiffré. Elle permet d’effectuer un traitement matriciel sécurisé des données. Cette solution s’inscrit dans le projet Followknee dans lequel l’objectif est de traiter de façon sécurisée des données issues d’une prothèse connectée sur un smartphone. Par la suite, nous avons entrepris d’observer l’influence de la compression sur la précision des modèles de machine learning. L’objectif de cette partie étant de voir s’il est possible de ne décompresser que partiellement des données et ainsi gagner en termes de coûts calculatoires avant de les utiliser dans de tels modèles. Suite à quoi,nous avons essayé de décompresser partiellement et de façon sécurisée des données grâce à des cryptosystèmes fully homomorphes. Ceci représente la première étape d’une chaîne de traitement plus complexe permettant de compresser des données puis de les chiffrer avant de les externaliser vers un cloud.Une fois externalisées, ces données pourront être partiellement décompressées afin d’être utilisées de façon sécurisée au travers d’algorithmes de traitement. Pour finir, nous avons étudié la possibilité d’utiliser un cryptosystème additivement homomorphe en combinaison de calcul multipartite afin de sécuriser l’apprentissage d’un réseau de neurones artificiels.
Fichier principal
Vignette du fichier
2021IMTA0259_Pistono-Maxime_Diffusion.pdf (3.33 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03513853 , version 1 (06-01-2022)

Identifiants

  • HAL Id : tel-03513853 , version 1

Citer

Maxime Pistono. Traitements sécurisés de données compressées : application à l’apprentissage automatique et aux implants connectés. Cryptographie et sécurité [cs.CR]. Ecole nationale supérieure Mines-Télécom Atlantique, 2021. Français. ⟨NNT : 2021IMTA0259⟩. ⟨tel-03513853⟩
181 Consultations
234 Téléchargements

Partager

Gmail Facebook X LinkedIn More