Apprentissage statistique pour extrêmes multivariés et fonctionnels
Auteur / Autrice : | Nathan Huet |
Direction : | Stephan Clémençon, Anne Sabourin |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 11/11/2024 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) - Laboratoire de Traitement et Communication de l'Information |
Etablissement opérateur d'inscription : Télécom Paris (Palaiseau, Essonne ; 1878-....) | |
Jury : | Président / Présidente : Pavlo Mozharovskyi |
Examinateurs / Examinatrices : Pavlo Mozharovskyi, Céline Duval, Clément Dombry, Aurélie Fischer | |
Rapporteur / Rapporteuse : Céline Duval, Clément Dombry |
Mots clés
Résumé
Dans un monde où le réchauffement climatique provoque de plus en plus de phénomènes météorologiques extrêmes d’ampleurs croissantes, cette thèse explore la modélisation des évènements extrêmes à travers des méthodes statistiques enrichies par l’apprentissage statistique. Elle se divise en deux grandes parties. Dans un premier temps, les extrêmes fonctionnels sont étudiés, c’est-à-dire les extrêmes de données dépendant explicitement d’une variable continue comme le temps. Nous travaillons dans un espace de Hilbert séparable, avec un focus sur l’espace L2[0, 1].Des résultats sur la variation régulière, hypothèse fondamentale en théorie des valeurs extrêmes, sont développés, et des caractérisations ainsi que des exemples non triviaux sont présentés. De plus, une méthode de réduction de dimension adaptée aux données fonctionnelles extrêmes est proposée, avec des garanties probabilistes et statistiques. Dans un second temps, nous développons un cadre probabiliste pour la régression dans des régions où la variable d’entrée est extrême, contrairement aux approches classiques qui se concentrent sur les régions où la variable de sortie est extrême. Des résultats sur les risques et les fonctions de régression dans les régions extrêmes, ainsi qu’un algorithme adapté, sont établis. Ce dernier est comparé à des méthodes classiques et appliquées à la prédiction des extrêmes maritimes. En Bretagne, où nous cherchons à compléter les données extrêmes passées pour réduire les incertitudes liées à certaines estimations.