Thèse soutenue

Problèmes d’estimation, de sélection de variables et de tests sous contraintes de confidentialité différentielle locale

FR  |  
EN
Auteur / Autrice : Amandine Dubois
Direction : Adrien SaumardCristina Butucea
Type : Thèse de doctorat
Discipline(s) : Mathématiques et Sciences et Technologies de l’Information et de la Communication. Spécialité : Mathématiques et leurs interactions
Date : Soutenance le 21/06/2021
Etablissement(s) : Rennes, École Nationale de la Statistique et de l'Analyse de l'Information
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Centre de Recherche en Economie et Statistique (Palaiseau ; 1993-....) - Centre de Recherche en Économie et Statistique / CREST
Jury : Président / Présidente : Bernard Delyon
Examinateurs / Examinatrices : Adrien Saumard, Cristina Butucea, Bernard Delyon, Béatrice Laurent, Aad W. van der Vaart, Gilles Blanchard, Alexandra Carpentier, Nicolas Verzelen
Rapporteur / Rapporteuse : Béatrice Laurent, Aad W. van der Vaart

Résumé

FR  |  
EN

La notion de confidentialité différentielle a été introduite pour permettre de réaliser des analyses statistiques tout en fournissant des garanties de protection des données personnelles analysées. Dans cette thèse, on s’intéresse à trois problèmes d’inférence statistique sous contraintes de confidentialité différentielle locale. Dans un premier temps, on s’intéresse à l’estimation non-paramétrique d’une densité de probabilité. Nous étudions le risque minimax Lr sur les ellipsoïdes de Besov, et nous intéressons à la question de l’adaptation au paramètre de régularité. On s’intéresse ensuite à l’identification du support de l’espérance d’une variable aléatoire suivant une loi normale d-dimensionnelle. Sous des hypothèses de sparsité, nous étudions le risque minimax lié à la distance de Hamming, et en déduisons des conditions nécessaires et suffisantes pour que l’identification du support soit possible. Enfin, nous étudions un problème de test d’adéquation pour des densités Höldériennes dont le support n’est pas supposé borné. Pour chaque problème, nous mettons en évidence l’influence des contraintes de confidentialité sur les vitesses minimax.