Validation croisée et pénalisation pour l'estimation de densité
Auteur / Autrice : | Nelo Magalhães |
Direction : | Lucien Birgé, Pascal Massart |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance le 26/05/2015 |
Etablissement(s) : | Paris 11 |
Ecole(s) doctorale(s) : | Ecole doctorale Mathématiques de la région Paris-Sud (1992-2015 ; Orsay) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de probabilités et modèles aléatoires (Paris ; 1997-2017) - Laboratoire de mathématiques d'Orsay (1998-....) |
Jury : | Président / Présidente : Yannick Baraud |
Examinateurs / Examinatrices : Lucien Birgé, Pascal Massart, Yannick Baraud, Vincent Rivoirard, Nicolas Vayatis, Guillaume Lecué | |
Rapporteur / Rapporteuse : Vincent Rivoirard, Nicolas Vayatis |
Mots clés
Résumé
Cette thèse s'inscrit dans le cadre de l'estimation d'une densité, considéré du point de vue non-paramétrique et non-asymptotique. Elle traite du problème de la sélection d'une méthode d'estimation à noyau. Celui-ci est une généralisation, entre autre, du problème de la sélection de modèle et de la sélection d'une fenêtre. Nous étudions des procédures classiques, par pénalisation et par rééchantillonnage (en particulier la validation croisée V-fold), qui évaluent la qualité d'une méthode en estimant son risque. Nous proposons, grâce à des inégalités de concentration, une méthode pour calibrer la pénalité de façon optimale pour sélectionner un estimateur linéaire et prouvons des inégalités d'oracle et des propriétés d'adaptation pour ces procédures. De plus, une nouvelle procédure rééchantillonnée, reposant sur la comparaison entre estimateurs par des tests robustes, est proposée comme alternative aux procédures basées sur le principe d'estimation sans biais du risque. Un second objectif est la comparaison de toutes ces procédures du point de vue théorique et l'analyse du rôle du paramètre V pour les pénalités V-fold. Nous validons les résultats théoriques par des études de simulations.