Confidentialité différentielle pour les espaces métriques : modèles théoriques de l'information pour la confidentialité et l'utilité avec de nouvelles applications aux domaines métriques
Auteur / Autrice : | Natasha Fernandes |
Direction : | Catuscia Palamidessi, Annabelle Mciver |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 28/05/2021 |
Etablissement(s) : | Institut polytechnique de Paris en cotutelle avec Macquarie University (Sydney, Australie) |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....) |
Laboratoire : Laboratoire d'informatique de l'École polytechnique (Palaiseau ; 1988-....) | |
Jury : | Président / Présidente : Steve Kremer |
Examinateurs / Examinatrices : Catuscia Palamidessi, Annabelle Mciver, Marco Gaboardi, Joshua Guttman, Michele Boreale, Giovanni Cherubin, David Baelde | |
Rapporteurs / Rapporteuses : Marco Gaboardi, Joshua Guttman, Michele Boreale |
Mots clés
Résumé
La "differential privacy", introduite par Dwork et al. en 2006, est devenue la référence en matière de protection de la vie privée dans les ensembles de données statistiques. Malgré sa popularité généralisée, son utilisation dans d'autres domaines a été relativement limitée. Dans cette thèse, nous explorons une généralisation de la "differential privacy" pour les domaines métriques appelés d-privacy. Notre approche intègre un cadre théorique de l'information pour analyser les flux d'informations, ce qui nous permet de fournir une caractérisation structurelle de la d-privacy et d'analyser ses propriétés de confidentialité et d'utilité. En utilisant l'analyse des flux d'informations, nous examinons l'ordre de fuite des canaux induit par le paramètre de confidentialité epsilon, nous trouvons une nouvelle caractérisation des mécanismes optimaux, étendant les résultats existants dans le domaine de l'optimalité universelle, et nous réexaminons le compromis privacy-utility pour flux de l'information dans un contexte "oblivious" et local. Enfin, nous démontrons l'applicabilité de la d-privacy à des domaines nouveaux et complexes avec des exemples d'applications dans la confidentialité des documents texte, l'utilité statistique et la recherche confidentielle des nearest neighbours.