Thèse soutenue

Segmentation de Processus de Comptage et modèles Dynamiques

FR  |  
EN
Auteur / Autrice : Elmokhtar Ezzahdi Alaya
Direction : Stéphane GaïffasAgathe Guilloux
Type : Thèse de doctorat
Discipline(s) : Statistique
Date : Soutenance le 27/06/2016
Etablissement(s) : Paris 6
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de statistique théorique et appliquée (Paris ; 2015-2017)
Jury : Examinateurs / Examinatrices : Pierre Alquier, Sylvain Arlot, Gérard Biau
Rapporteur / Rapporteuse : Erwan Le Pennec, Jacobo de Uña-Álvarez

Résumé

FR  |  
EN

Dans la première partie de cette thèse, nous cherchons à estimer l'intensité d'un processus de comptage par des techniques d'apprentissage statistique en grande dimension. Nous introduisons une procédure d'estimation basée sur la pénalisation par variation totale avec poids. Un premier ensemble de résultats vise à étudier l'intensité sous une hypothèse a priori de segmentation sparse. Dans une seconde partie, nous étudions la technique de binarisation de variables explicatives continues, pour laquelle nous construisons une régularisation spécifique à ce problème. Cette régularisation est intitulée ``binarsity'', elle pénalise les valeurs différentes d'un vecteur de paramètres. Dans la troisième partie, nous nous intéressons à la régression dynamique pour les modèles d'Aalen et de Cox avec coefficients et covariables en grande dimension, et pouvant dépendre du temps. Pour chacune des procédures d'estimation proposées, nous démontrons des inégalités oracles non-asymptotiques en prédiction. Nous utilisons enfin des algorithmes proximaux pour résoudre les problèmes convexes sous-jacents, et nous illustrons nos méthodes sur des données simulées et réelles.