Thèse soutenue

Sécurité des données stockées sur molécules d’ADN

FR  |  
EN
Auteur / Autrice : Chloé Berton
Direction : Gouenou CoatrieuxDominique Lavenier
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 01/10/2024
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur et le numérique
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Enseignement et de Recherche sur le Traitement de l'Information Médicale (Marseille)
Jury : Président / Présidente : Yannick Rondelez
Examinateurs / Examinatrices : Gouenou Coatrieux, Dominique Lavenier, Pascal Barbry, Maryline Laurent, Emmanuelle Génin
Rapporteurs / Rapporteuses : Pascal Barbry, Maryline Laurent

Résumé

FR  |  
EN

La quantité de données numériques produites dans le monde chaque année augmente exponentiellement et les supports actuels de stockage atteignent leurs limites. Dans ce contexte, le stockage de données sur molécules d'ADN est très prometteur. Stockant jusqu’à 10¹⁸ octets par gramme d'ADN pour une consommation d'énergie quasi nulle, il a une durée de vie 100 fois plus longue que les disques durs. Cette technologie de stockage étant en développement, il est opportun d’y intégrer nativement des mécanismes pour sécuriser les données. C’est l’objet de cette thèse. Notre première contribution est une analyse des risques de l’ensemble de la chaîne de stockage, qui nous a permis d’identifier des vulnérabilités des procédés numériques et biologiques, en termes de confidentialité, d’intégrité, de disponibilité et de traçabilité. Une seconde contribution est l’identification d’opérateurs élémentaires permettant des manipulations simples de l’ADN. Avec ceux-ci, nous avons développé notre troisième contribution, une solution de chiffrement DNACipher qui impose un déchiffrement biomoléculaire des molécules avant de pouvoir lire les données correctement. Cette solution, qui repose sur des enzymes, a nécessité le développement d’un codage des données numériques en séquences ADN appelée DSWE ; notre quatrième contribution. Cet algorithme respecte les contraintes liées aux procédés biologiques (e.g. homopolymères) et à notre DNACipher. Enfin, notre dernière contribution est une validation expérimentale de notre chaîne de stockage sécurisée. C’est la première preuve de concept montrant qu’il est possible de sécuriser ce nouveau support de stockage sur la base de manipulations biomoléculaires.