Méthodes bayésiennes computationnelles pour l'estimation de quantiles extrêmes à partir de données environnementales
Auteur / Autrice : | Théo Moins |
Direction : | Stéphane Girard, Julyan Arbel, Anne Dutfoy |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 19/09/2023 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Jean Kuntzmann (Grenoble) |
Jury : | Président / Présidente : Anne-Catherine Favre Pugin |
Examinateurs / Examinatrices : Antonio Canale | |
Rapporteurs / Rapporteuses : Clément Dombry, Robin Ryder |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse se situe à l'intersection de deux domaines de recherche: la statistique des valeurs extrêmes et la statistique bayésienne. L'objectif principal est d’utiliser des méthodes bayésiennes pour l'estimation de quantiles extrêmes de données environnementales. L'utilisation du point de vue bayésien est motivée par différentes problématiques liées à l'estimation des quantiles extrêmes. Tout d’abord, cela permet de directement prendre en compte différentes sources d’incertitudes dans un estimateur ponctuel, par exemple en utilisant des lois dites prédictives. Ensuite, cela permet d’accéder à des intervalles de crédibilité pour quantifier la marge d’erreur autour de l’estimation. Enfin, un dernier objectif est de fournir des éléments de réponse quant à la quantification des limites de crédibilité d’extrapolation, c’est-à-dire de déterminer jusqu’où il est raisonnable d’extrapoler la queue de distribution pour l'estimation de quantiles par exemple.La première contribution de cette thèse porte sur l’amélioration de méthodes bayésiennes computationnelles par la reparamétrisation de modèles d’extrêmes. En particulier, l’étude met en évidence deux avantages à l’utilisation d’une paramétrisation dite orthogonale. D'abord, elle améliore significativement la convergence d’algorithmes MCMC. Ensuite, elle facilite le calcul de la loi a priori de Jeffreys pour le modèle d’extrêmes caractérisé par un processus de Poisson, et permet de démontrer la propreté de la loi a posteriori associée. Cette analyse est complétée par l’utilisation d’un a priori semi-informatif appelé PC prior, qui est également calculé à partir de la vraisemblance du processus de Poisson.La deuxième contribution concerne l’amélioration du diagnostic de Gelman-Rubin noté R-hat pour la convergence des algorithmes MCMC. Une nouvelle version est proposée, basée sur une version localisée qui permet d'identifier un problème de convergence sur un quantile donné de la loi cible. Sa construction repose sur une étude théorique qui permet, entre autre, d’associer un seuil à partir duquel on estime que les chaînes MCMC n'ont pas convergé à un niveau de confiance fixé. Le cas multivarié est également traité, et des simulations sur des modèles bayésiens viennent compléter la proposition.La troisième contribution de la thèse consiste en des résultats préliminaires sur le comportement de différents estimateurs bayésiens à taille d’échantillon fini. L’objectif est de comprendre comment les estimateurs se comportent dans la queue, en prenant en compte l’incertitude associée à l’estimation des paramètres. Les résultats portent sur le domaine d’attraction des lois prédictives (a priori et a posteriori), ainsi que sur un équivalent asymptotique de deux méthodes pour estimer un niveau de retour extrême, dans le cas d’une loi extit{a priori} uniforme sur le paramètre de forme.Enfin, la dernière contribution de cette thèse est l’application du modèle et de tout les résultats précédents à des séries de données environnementales. Cela permet une estimation de niveaux de retour centennaux, millénaux et décamillénaux de débits de rivières et de vitesses de vents, ainsi que d’apporter des éléments de réponse sur les limites d’extrapolation dans la queue de distribution.