Thèse soutenue

Contributions à des problèmes de classement et à la détection de rupture en grande dimension

FR  |  
EN
Auteur / Autrice : Emmanuel Pilliat
Direction : Joseph Salmon
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 08/12/2023
Etablissement(s) : Université de Montpellier (2022-....)
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....)
Jury : Examinateurs / Examinatrices : Joseph Salmon, Arnak S. Dalalyan, Béatrice Laurent, Nicolas Verzelen, Alexandra Carpentier, Claire Boyer, Cristina Butucea
Rapporteurs / Rapporteuses : Arnak S. Dalalyan, Sivaraman Balakrishnan

Résumé

FR  |  
EN

Cette thèse explore deux domaines en statistique moderne : les problèmes de classement et la détection de points de rupture. Les deux sujets sont étudiés dans le cadre des statistiques en grande dimension, où le nombre de paramètres inconnus peut être supérieur au nombre d'échantillons. Pour gérer cette complexité, nous introduisons des hypothèses spécifiques ou des contraintes de forme dans les modèles.La première partie de la thèse examine des problèmes de classement, qui impliquent d'ordonner des éléments sur la base d'observations bruitées et partielles. Principalement, nous examinons deux modèles qui visent à retrouver une permutation des lignes d'une matrice ayant des contraintes de forme spécifiques. Plus précisément, nous considérons le modèle monotone où la matrice réordonnée a des colonnes croissantes, et le modèle bi-monotone où à la fois ses colonnes et ses lignes sont croissantes.Pour chacun des modèles, nous développons un algorithme calculable en temps polynomial pour estimer la permutation inconnue, et nous prouvons qu'il atteint des garanties presque optimales.La deuxième partie s'attarde sur la détection de plusieurs points de rupture dans des séries temporelles en grande dimension. Bien que nous considérions un cadre général pour les points de rupture, l'accent principal est mis sur le cas où nous cherchons à détecter des ruptures dans la moyenne des données. Nous établissons les taux optimaux minimax qui sont adaptatifs à la fois à la parcimonie inconnue de ces points de rupture, et à la distance entre les points de rupture.