Thèse en cours

Méthodes des processus empiriques pour la régression distributionnelle

FR  |  
EN
Auteur / Autrice : Ralph Fenelon
Direction : Davit VarronClément Dombry
Type : Projet de thèse
Discipline(s) : Mathématiques
Date : Inscription en doctorat le 01/10/2024
Etablissement(s) : Besançon, Université Marie et Louis Pasteur
Ecole(s) doctorale(s) : École doctorale Carnot-Pasteur
Partenaire(s) de recherche : Laboratoire : Laboratoire de Mathématiques de Besançon

Résumé

FR  |  
EN

Le cadre statistique de cette thèse est le problème de régression distributionnelle, c'est-à-dire comment modéliser et estimer correctement les fonctions de distribution cumulative conditionnelle. Ce sujet est plus complexe que ce que l'on rencontre généralement dans la régression classique : au lieu de construire des prédictions ponctuelles, nous prédisons plutôt la distribution conditionnelle entière. La régression distributionnelle est pertinente dans divers domaines, tels que la météorologie, la forêt aléatoire distributionnelle, la prévision probabiliste, la régression quantile ou la régression distributionnelle additive structurée. La méthode du réseau de régression distributionnelle (DRN) a été développée comme une évolution du cadre classique ‘Ensemble Model Output Statistics' (EMOS), ajoutant beaucoup plus de flexibilité à l'aide des réseaux de neurones. DRN vise à améliorer la capacité du modèle à représenter des phénomènes complexes en employant des approches mieux adaptées aux structures non linéaires des données météorologiques, par opposition aux méthodes traditionnelles reposant sur des liens linéaires et fixes. Cette approche offre une plus grande flexibilité et adaptabilité pour modéliser les relations entre les variables prédictives et les paramètres de manière plus réaliste. Dans cette thèse, nous étudierons la procédure d'estimation basée sur le principe empirique de minimisation des risques, en utilisant une fonction de risque basée sur le 'Continuous Ranked Probability Score' (CRPS). En utilisant des techniques issues de la théorie des processus empiriques, cette thèse se concentrera sur les objectifs suivants : 1-Calibration du modèle : fournir des estimations non asymptotiques pour l'erreur d'estimation. 2-Sélection du modèle : fournir des estimations non asymptotiques du regret, via une minimisation des erreurs de validation. 3-Agrégation de modèles : fournit des estimations non asymptotiques du regret pour l'agrégation convexe des modèles.