Estimation dans le modèle de régression monotone single index en grande dimension

par Christopher Fragneau

Thèse de doctorat en Mathématiques appliquées et applications mathématiques

Sous la direction de Cécile Durot.

Soutenue le 12-10-2020

à Paris 10 , dans le cadre de École doctorale Connaissance, langage et modélisation (Nanterre) , en partenariat avec Modal'X (Nanterre). Université Paris Nanterre (laboratoire) .


  • Résumé

    Cette thèse s’inscrit dans le modèle de régression monotone single-index selon lequel une variable réelle Y est liée à un vecteur réel X de taille d, par la relation E[Y|X] = f(aTX) p.s., où la fonction monotone réelle f et aT, la transposée du vecteur a de taille d, sont inconnus. Ce modèle est réputé en économie, médecine et biostatistiques où la monotonie de f est naturelle. Lorsque a est dans S, la sphère unité de dimension d, ma finalité est l’estimation de (a,f) fondée sur n observations de (X,Y) dans le cadre de la grande dimension, où d dépend de n et peut tendre vers l’infini avec n. Le premier Chapitre présente la théorie de l’estimation monotone, de la grande dimension et le modèle de régression single-index. Le second chapitre étudie les minimiseurs des critères population des moindres carrés et du maximum de vraisemblance sur des classes K de couples (b,g) où b est dans un sous-ensemble de S et g est monotone. Cette étude est requise pour la convergence des estimateurs contraints sur K, qui fait l'objet du troisième chapitre. Dans le cadre où d dépend de n et la loi de X est bornée ou sous-Gaussienne, j’établis la vitesse de convergence des estimateurs de f(aT·), a et f dans lecas où (a,f) ∈K, ainsi que la consistance des estimateurs de f(aT·) dans le cas contraire. Le quatrième chapitre propose une méthode d’estimation de (a,f) lorsque X est un vecteur Gaussien. Elle consiste àse placer dans un modèle linéaire mal spécifié, et à estimer son vecteur des paramètres grâce à la méthode du de-sparcified Lasso de Zhang et Zhang (2014). Je prouve que l’estimateur résultant divisé par sa norme Euclidienne est Gaussien et converge vers a, à vitesse paramétrique. Je propose des estimateurs de f(aT·) et f ainsi que leurs vitesses de convergence.

  • Titre traduit

    High dimensional estimation in monotone single index models


  • Résumé

    The framework of this thesis is the monotone single-index model which assumes that a real variable Y is linked to a d dimensional real vector X through the relationship E[Y|X] = f(aTX) a.s., where the real monotonic function f and aT, the transposed vector of a are unknown. This model is well-known in economics, medecine and biostatistics where the monotonicity of f appears naturally. Given n replications of (X,Y) and assuming that a belongs to S, the d unit dimensional sphere, my main aim is to estimate (a,f) in the high dimensional context, where d is allowed to depend on n and to grow to infinity with n. First Chapter introduces the theory of monotone estimation, the high-dimensional context, and the single-index model. Second Chapter studies the minimizers of least-squares and maximum likelihood population criteria over classes K of couples (b,g) where b belongs to a subset of S and g is monotonic. My results are are needed for constrained estimators convergence purposes over K, the aim of the Third Chapter. In a setting where d depends on n and the distribution of X is eitherbounded or sub-Gaussian, I establish the rates of convergence of the estimators of f(aT·), a and f in case where (a,f) ∈ K, as well as the consistency of estimators of f(aT·), otherwise. Fourth Chapter furnishes an estimation method of (a,f) when X is assumed to be a Gaussian vector. This method fits a mispecified linear model, and estimates its parameter vector thanks to the de-sparcified Lasso method of Zhang and Zhang (2014). I show that the resulting estimator divided by its Euclidean norm is Gaussian and converges to a, at parametric rate. I provide estimators of f(aT·) and f, and I establish their rates of convergence.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris Nanterre. Service commun de la documentation. Bibliothèque virtuelle.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.