Understanding and optimizing the trade-off between privacy and utility from a foundational perspective
Auteur / Autrice : | Sayan Biswas |
Direction : | Catuscia Palamidessi |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 18/10/2023 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique de l'École polytechnique (Palaiseau ; 1988-....) - Laboratoire d'informatique de l'École polytechnique [Palaiseau] / LIX |
Jury : | Président / Présidente : Benjamin Nguyen |
Examinateurs / Examinatrices : Catuscia Palamidessi, Aurélien Bellet, Marco Gaboardi, Anne-Marie Kermarrec, Graham Cormode, Simon Oya, Ehab Elsalamouny | |
Rapporteur / Rapporteuse : Aurélien Bellet, Marco Gaboardi |
Mots clés
Résumé
Avec les récentes avancées technologiques, les menaces de violation de la vie privée concernant les données personnelles des individus se multiplient comme jamais auparavant. Si la protection de la confidentialité des informations sensibles devient plus importante que jamais, il est également extrêmement crucial de préserver l'utilité des données, d'autant plus que celles-ci deviennent l'une des ressources les plus essentielles dans la société contemporaine basée sur l'information. La protection différentielle de la vie privée est considérée comme l'étalon-or des garanties formelles de protection de la vie privée. Son applicabilité étendue, ses techniques de mise en œuvre simples et ses propriétés formelles ont conduit à une croissance rapide de la popularité et de l'intérêt pour l'étude et l'application de la confidentialité différentielle à une variété de domaines, tant dans les universités que dans l'industrie. Au fil du temps, la communauté a exploré diverses variantes du DP pour répondre aux préoccupations en matière de protection de la vie privée dans différents contextes et dans le cadre de divers modèles de menace.Malgré l'acceptation prolifique du DP par la communauté, il est encore difficile d'interpréter la manière dont il interagit avec les données et affecte leur utilité. Par conséquent, il est nécessaire de répondre à des questions rudimentaires telles que la manière dont l'ajout de bruit DP affecte l'utilité des données partagées (par exemple, la qualité de service des propriétaires de données, l'utilité statistique des fournisseurs de services, la précision de l'analyse et de l'entraînement des modèles effectués, etc. L'objectif de cette thèse est de répondre à ces questions et, en particulier, d'établir une base théorique pour analyser de manière exhaustive le compromis entre la protection de la vie privée et l'utilité des données sensibles selon diverses perspectives et dans le contexte de différents cas d'utilisation. Outre la dissection de la bataille séculaire entre la vie privée et l'utilité, cette thèse étudie et développe également des mécanismes de préservation de la vie privée pour aller dans le sens de l'optimisation de la perte d'utilité avec des garanties formelles de protection de la vie privée dans divers domaines d'applicabilité.