Thèse soutenue

Algorithmes pour la synchronisation de données et leur stockage sur ADN

FR  |  
EN
Auteur / Autrice : Belaid Hamoum
Direction : Emmanuel BoutillonElsa Dupraz
Type : Thèse de doctorat
Discipline(s) : Mathématiques et Sciences et Technologies de l’Information et de la Communication Spécialité : Télécommunications
Date : Soutenance le 15/12/2022
Etablissement(s) : Lorient
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance (Brest ; 2012-....)
Laboratoire : Laboratoire des sciences et techniques de l'information- de la communication et de la connaissance / Lab-STICC
Jury : Président / Présidente : Aline Roumy
Examinateurs / Examinatrices : Iryna Andriyanova
Rapporteurs / Rapporteuses : Marc Antonini, Jossy Sayir

Résumé

FR  |  
EN

175 zettaoctets. C'est la capacité estimée pour pouvoir stocker les données numériques en 2025. Malgré le fait que des centres de données plus grands que des stades et à forte empreinte carbone sont déployés chaque année, la croissance de la capacité de stockage est inférieure aux besoins. Le Stockage de Données sur ADN (SDA) pourrait être la solution. En effet, l'ADN est un support extrêmement dense de stockage de données. De plus, il a une très longue durée de vie et peut être stocké à température ambiante. Cependant, le principal inconvénient du SDA est sa grande quantité d'erreurs d'insertions, suppressions, et substitutions. Par conséquent, pour construire des SDA pratiques et fiables, il est nécessaire de mettre en œuvre des solutions de correction d'erreurs. Cependant, la plupart des solutions de correction d'erreurs conventionnelles ne corrigent que les erreurs de substitution et échouent complètement à corriger les insertions et les suppressions. Cette thèse vise à résoudre plusieurs problèmes liés à la mise en œuvre de systèmes pratiques de SDA. Nous avons d'abord proposé un modèle de canal avec mémoire, qui modélise avec précision le canal de SDA. Ce modèle de canal permet notamment de faire des simulations numériques et de concevoir des codes correcteurs d'erreurs efficaces. Nous avons ensuite proposé et évalué deux solutions de correction d'erreurs. La deuxième solution basée sur des codes convolutifs a notamment permis un gain de performance important par rapport à la première solution et aux codes convolutifs de l'état de l'art. Enfin, nous avons également proposé un algorithme de déduplication de données appelé PBDA-SW, qui améliore l'état de l'art.