Thèse soutenue

Problèmes d’inférence non-paramétrique et en grande dimension

FR  |  
EN
Auteur / Autrice : Julien Chhor
Direction : Alexandre B. Tsybakov
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 30/08/2022
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard
Partenaire(s) de recherche : Laboratoire : Centre de Recherche en Economie et Statistique (Palaiseau ; 1993)
établissement opérateur d'inscription : École nationale de la statistique et de l'administration économique (Palaiseau ; 1960-....)
Jury : Président / Présidente : Cristina Butucea
Examinateurs / Examinatrices : Alexandre B. Tsybakov, Cristina Butucea, Béatrice Laurent, Chao Gao, Yannick Baraud, Richard J. Samworth
Rapporteurs / Rapporteuses : Béatrice Laurent, Chao Gao

Résumé

FR  |  
EN

Dans cette thèse, nous traitons les sujets suivants: tests minimax locaux, estimation sous contraintes combinées de robustesse et de confidentialité locale différentielle, estimation adaptative en régression non-paramétrique avec benign overfitting.Nous étudions en premier lieu le problème de test minimax d'adéquation pour des lois discrètes et des lois à densité Hölder-régulières.Le problème consiste à tester l'égalité à une loi connue contre une alternative composée de distributions séparées de l'hypothèse nulle au sens d'une certaine métrique.Nous identifions les vitesses locales non-asymptotiques sur la séparation nécessaire pour assurer l'existence d'un test uniformément consistant et nous donnons leur dépendance précise par rapport à l'hypothèse nulle pour différentes distances de séparation.Nous identifions également les tests locaux optimaux correspondants.Nous étudions le problème d'estimation de lois discrètes avec contrainte de confidentialité differentielle locale en supposant de plus que les données sont issues d'un modèle de contamination adversariale.Nous proposons un algorithme robuste aux outliers et adapté à la confidentialité, dont nous montrons l'optimalité statistique ainsi que l'efficacité en temps de calcul.Enfin, dans le cadre de la régression non-paramétrique, nous utilisons des estimateurs par polynômes locaux avec noyau singulier afin de construire des estimateurs continus, minimax et adaptatifs à la régularité inconnue de la fonction à estimer, et qui interpolent tous les points de données avec grande probabilité - un phenomène connu sous le nom de ``benign overfitting".