Thèse soutenue

Application des grandes matrices aléatoires aux séries temporelles multivariables

FR  |  
EN
Auteur / Autrice : Daria Tieplova
Direction : Philippe Loubaton
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 17/12/2020
Etablissement(s) : Paris Est en cotutelle avec Verkin Institute for low temperature physics and engineering (Kharkiv, Ukraine)
Ecole(s) doctorale(s) : École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication (Champs-sur-Marne, Seine-et-Marne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de l'Institut Gaspard Monge (1997-2009) - Laboratoire d'informatique de l'Institut Gaspard Monge
Jury : Président / Présidente : Mariya Shcherbina
Examinateurs / Examinatrices : Philippe Loubaton, Oleksiy Khorunzhiy, Sergey Favorov, Iryna Egorova, Florence Merlevède, Leonid Andreevič Pastur, Jamal Najim
Rapporteurs / Rapporteuses : Oleksiy Khorunzhiy, Sergey Favorov

Résumé

FR  |  
EN

Des techniques issues du domaine des grandes matrices aléatoires ont été récemment utilisées afin d'aborder des problèmes de traitement du signal en grande dimension. Dans leur grande majorité, les travaux correspondants ont étudié des schémas d'estimation basés sur des fonctionnelles de la matrice de covariance empirique des observations. Cependant, de nombreux problèmes mettant en jeu des séries temporelles de grande dimension font naturellement apparaître des matrices plus générales que les matrices de covariance empirique. Le but de cette thèse est d'étudier les valeurs singulières de deux types de grandes matrices aléatoires jouant un rôle fondamental en statistiques des séries temporelles multivariables, et de déduire des résultats un nouvelle approche permettant d'estimer la dimension minimale des représentations d'état d'un certain type de série temporelle de grande dimension à spectre rationnel. Plus précisément, l'observation y_n est supposée être une version bruitée d'une série temporelle (u_n)_{nin Z} de dimension M dont la densité spectrale est rationnelle et de rang déficient, le bruit additif (v_n)_{nin Z} étant supposé être blanc et gaussien complexe de matrice de covariance inconnue. Dans ce contexte, il est tout à fait fondamental d'être capable d'estimer de façon consistante la dimension minimale P des représentations d'état de u à partirdes N observations y_1,y_2,...,y_N. Si L>P, les approches les plus traditionnelles sont basées sur le fait que P coïncide avec le rang de la matrice d'autocovariance R^L_{f|p} entre les vecteurs de dimension ML (y_{n+L}^T,..,y_{n+2L-1}^T)^T et (y_n^T,..,y_{n+L-1}^T)^T, mais aussi avec le nombre de valeurs singulières non nulles de la matrice normalisée C^L = (R^L)^{-1/2}R^L_{f|p} (R^L)^{-1/2}, où R^L représente la matrice de covariance des 2 vecteurs qui viennent d'être introduits. Dans le régime asymptotique usuel dans lequel N->+infty et M et L restent fixes, les matrices R^L_{f|p} et C^L peuvent être estimées par leurs versionsempiriques hat{R}^L_{f|p} et hat{C}^L, et P peut être évalué à partir des plus grandes valeurs singulières de ces estimateurs. Dans le régime des grandes dimensions dans lequel M et N->+infty de telle sorte que ML/N converge vers 0<c*<1, L étant fixe, hat{R}^L_{f|p} et hat{C}^L ne sont plus des estimateurs consistants de R^L_{f|p} et C^L. Dans ces conditions, il n'est pas évident qu'il soit toujours possible d'estimer P à partir des valeurs singulières de ces matrices. Dans cette thèse, le comportement des valeurs singulières de hat{R}^L_{f|p} et hat{C}^L est étudiée dans le régime des grandes dimensions.Le cas où u=0 est tout d'abord considéré. Il est établi que les distributions empiriques des valeurs singulières de hat{R}^L_{f|p} et hat{C}^L convergent vers une limitedont les supports S_R et S_C sont caractérisés. Il est montré que S_C=[0,2sqrt{c*(1-c*)}]&{1}{bf 1}_{c*>1/2}, et que S_R a une structure plus compliquée. De plus, toutes les valeurs singulières de hat{R}^L_{f|p} et hat{C}^L sont situées au voisinage de S_R et S_C respectivement. Si u est non nul, la dégénérescence du rang de la densité spectrale de u est utilisée pour étudier si certaines valeurs singulières de hat{R}^L_{f|p} et hat{C}^L s'échappent de S_R et S_C. Il est montré que le nombre de valeurs singulières de hat{R}^L_{f|p} situées en dehors de S_R n'est pas directement relié à P, mais que, P coïncide avec le nombre de valeurs singulières de hat{C}^L qui sont plus grandes que 2sqrt{c*(1-c*)} si c*<1/2, si le signal est suffisamment puissant par rapport au bruit, et si les valeurs singulières non nulles de C^L sont suffisamment grandes. Ces résultats impliquent que les valeurs singulières de hat{R}^L_{f|p} ne peuvent pas être utilisées pour estimer P dans le régime des grandes dimensions. Par contre, moyennant quelques hypothèses, P peut être estimé de façon consistante par le nombre de valeurs singulières de hat{C}^L qui sont plus grandes que 2sqrt{c*(1-c*)}