Problèmes d’estimation, de sélection de variables et de tests sous contraintes de confidentialité différentielle locale
Auteur / Autrice : | Amandine Dubois |
Direction : | Adrien Saumard, Cristina Butucea |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques et Sciences et Technologies de l’Information et de la Communication. Spécialité : Mathématiques et leurs interactions |
Date : | Soutenance le 21/06/2021 |
Etablissement(s) : | Rennes, École Nationale de la Statistique et de l'Analyse de l'Information |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Centre de Recherche en Economie et Statistique (Palaiseau ; 1993-....) - Centre de Recherche en Économie et Statistique / CREST |
Jury : | Président / Présidente : Bernard Delyon |
Examinateurs / Examinatrices : Adrien Saumard, Cristina Butucea, Bernard Delyon, Béatrice Laurent, Aad W. van der Vaart, Gilles Blanchard, Alexandra Carpentier, Nicolas Verzelen | |
Rapporteur / Rapporteuse : Béatrice Laurent, Aad W. van der Vaart |
Mots clés
Résumé
La notion de confidentialité différentielle a été introduite pour permettre de réaliser des analyses statistiques tout en fournissant des garanties de protection des données personnelles analysées. Dans cette thèse, on s’intéresse à trois problèmes d’inférence statistique sous contraintes de confidentialité différentielle locale. Dans un premier temps, on s’intéresse à l’estimation non-paramétrique d’une densité de probabilité. Nous étudions le risque minimax Lr sur les ellipsoïdes de Besov, et nous intéressons à la question de l’adaptation au paramètre de régularité. On s’intéresse ensuite à l’identification du support de l’espérance d’une variable aléatoire suivant une loi normale d-dimensionnelle. Sous des hypothèses de sparsité, nous étudions le risque minimax lié à la distance de Hamming, et en déduisons des conditions nécessaires et suffisantes pour que l’identification du support soit possible. Enfin, nous étudions un problème de test d’adéquation pour des densités Höldériennes dont le support n’est pas supposé borné. Pour chaque problème, nous mettons en évidence l’influence des contraintes de confidentialité sur les vitesses minimax.