Thèse soutenue

Analyse des risques liés à la publication de données temporelles : application aux données de consommation électriques

FR  |  
EN
Auteur / Autrice : Antonin Voyez
Direction : Élisa FromontGildas Avoine
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 11/07/2023
Etablissement(s) : Université de Rennes (2023-....)
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....)
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - LACODAM
Jury : Président / Présidente : Benjamin Nguyen
Examinateurs / Examinatrices : Marie-Christine Rousset, Tristan Allard
Rapporteurs / Rapporteuses : Nicolas Travers, Engelbert Mephu-Nguifo

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Enedis est le principal gestionnaire de distribution d’électricité en France. Les distributeurs sont légalement obligé de mesurer et de publier la consommation électrique française. Les mesures contiennent de nombreuses informations personnelles et sensibles. De fait, la publication est anonymisée à l’aide d’agrégats par seuils. Ce travail étudie la vulnérabilité liée à la publication des mesures de consommation électrique. Notre première contribution est une étude statistique à grande échelle des mesures d’électricité française. En particulier, nous réalisons une étude d’unicité montrant que les séries non anonymisées sont très facilement identifiables. Notre deuxième contribution est une attaque par inférence d’appartenance qui permet de trouver toutes les séries formant un agrégat. Cette attaque est basée sur une variante du problème de la somme des sous-ensembles. Notre troisième contribution est une attaque par inférence d’appartenance modélisée comme un problème de classification de séries temporelles. Cette attaque nécessite peu de connaissances préalables et permet de trouver une cible spécifique dans un agrégat. Nous réalisons des expériences approfondies sur les attaques. Les résultats permettent de mieux choisir le seuil de publication. Enfin, nous proposons une méthode pour estimer la vulnérabilité des séries.