Thèse soutenue

Apprentissage statistique pour extrêmes multivariés et fonctionnels

FR  |  
EN
Auteur / Autrice : Nathan Huet
Direction : Stephan ClémençonAnne Sabourin
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 11/11/2024
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) - Laboratoire de Traitement et Communication de l'Information
Etablissement opérateur d'inscription : Télécom Paris (Palaiseau, Essonne ; 1878-....)
Jury : Président / Présidente : Pavlo Mozharovskyi
Examinateurs / Examinatrices : Pavlo Mozharovskyi, Céline Duval, Clément Dombry, Aurélie Fischer
Rapporteur / Rapporteuse : Céline Duval, Clément Dombry

Résumé

FR  |  
EN

Dans un monde où le réchauffement climatique provoque de plus en plus de phénomènes météorologiques extrêmes d’ampleurs croissantes, cette thèse explore la modélisation des évènements extrêmes à travers des méthodes statistiques enrichies par l’apprentissage statistique. Elle se divise en deux grandes parties. Dans un premier temps, les extrêmes fonctionnels sont étudiés, c’est-à-dire les extrêmes de données dépendant explicitement d’une variable continue comme le temps. Nous travaillons dans un espace de Hilbert séparable, avec un focus sur l’espace L2[0, 1].Des résultats sur la variation régulière, hypothèse fondamentale en théorie des valeurs extrêmes, sont développés, et des caractérisations ainsi que des exemples non triviaux sont présentés. De plus, une méthode de réduction de dimension adaptée aux données fonctionnelles extrêmes est proposée, avec des garanties probabilistes et statistiques. Dans un second temps, nous développons un cadre probabiliste pour la régression dans des régions où la variable d’entrée est extrême, contrairement aux approches classiques qui se concentrent sur les régions où la variable de sortie est extrême. Des résultats sur les risques et les fonctions de régression dans les régions extrêmes, ainsi qu’un algorithme adapté, sont établis. Ce dernier est comparé à des méthodes classiques et appliquées à la prédiction des extrêmes maritimes. En Bretagne, où nous cherchons à compléter les données extrêmes passées pour réduire les incertitudes liées à certaines estimations.