Thèse soutenue

Estimation adaptative avec des données transformées ou incomplètes. Application à des modèles de survie

FR  |  
EN
Auteur / Autrice : Gaëlle Chagny
Direction : Fabienne Comte
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 05/07/2013
Etablissement(s) : Paris 5
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Mathématiques appliquées Paris 5
Jury : Président / Présidente : Dominique Picard
Examinateurs / Examinatrices : Fabienne Comte, Dominique Picard, Oleg V. Lepski, Patricia Reynaud-Bouret, Jérôme Dedecker, Cécile Durot, Christophe Giraud, Agathe Guilloux
Rapporteur / Rapporteuse : Oleg V. Lepski, Patricia Reynaud-Bouret

Résumé

FR  |  
EN

Cette thèse présente divers problèmes d'estimation fonctionnelle adaptative par sélection d'estimateurs en projection ou à noyaux, utilisant des critères inspirés à la fois de la sélection de modèles et des méthodes de Lepski. Le point commun de nos travaux est l'utilisation de données transformées et/ou incomplètes. La première partie est consacrée à une procédure d'estimation par ''déformation'', dont la pertinence est illustrée pour l'estimation des fonctions suivantes : régression additive et multiplicative, densité conditionnelle, fonction de répartition dans un modèle de censure par intervalle, risque instantané pour des données censurées à droite. Le but est de reconstruire une fonction à partir d'un échantillon de couples aléatoires (X,Y). Nous utilisons les données déformées (ф(X),Y) pour proposer des estimateurs adaptatifs, où ф est une fonction bijective que nous estimons également (par exemple la fonction de répartition de X). L'intérêt est double : d'un point de vue théorique, les estimateurs ont des propriétés d'optimalité au sens de l'oracle ; d'un point de vue pratique, ils sont explicites et numériquement stables. La seconde partie s'intéresse à un problème à deux échantillons : nous comparons les distributions de deux variables X et Xₒ au travers de la densité relative, définie comme la densité de la variable Fₒ(X) (Fₒ étant la répartition de Xₒ). Nous construisons des estimateurs adaptatifs, à partir d'un double échantillon de données, possiblement censurées. Des bornes de risque non-asymptotiques sont démontrées, et des vitesses de convergences déduites.