Segmentation de Processus de Comptage et modèles Dynamiques
Auteur / Autrice : | Elmokhtar Ezzahdi Alaya |
Direction : | Stéphane Gaïffas, Agathe Guilloux |
Type : | Thèse de doctorat |
Discipline(s) : | Statistique |
Date : | Soutenance le 27/06/2016 |
Etablissement(s) : | Paris 6 |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de statistique théorique et appliquée (Paris ; 2015-2017) |
Jury : | Examinateurs / Examinatrices : Pierre Alquier, Sylvain Arlot, Gérard Biau |
Rapporteur / Rapporteuse : Erwan Le Pennec, Jacobo de Uña-Álvarez |
Résumé
Dans la première partie de cette thèse, nous cherchons à estimer l'intensité d'un processus de comptage par des techniques d'apprentissage statistique en grande dimension. Nous introduisons une procédure d'estimation basée sur la pénalisation par variation totale avec poids. Un premier ensemble de résultats vise à étudier l'intensité sous une hypothèse a priori de segmentation sparse. Dans une seconde partie, nous étudions la technique de binarisation de variables explicatives continues, pour laquelle nous construisons une régularisation spécifique à ce problème. Cette régularisation est intitulée ``binarsity'', elle pénalise les valeurs différentes d'un vecteur de paramètres. Dans la troisième partie, nous nous intéressons à la régression dynamique pour les modèles d'Aalen et de Cox avec coefficients et covariables en grande dimension, et pouvant dépendre du temps. Pour chacune des procédures d'estimation proposées, nous démontrons des inégalités oracles non-asymptotiques en prédiction. Nous utilisons enfin des algorithmes proximaux pour résoudre les problèmes convexes sous-jacents, et nous illustrons nos méthodes sur des données simulées et réelles.