Thèse soutenue

Prédiction spatio-temporelle par équations aux dérivées partielles stochastiques
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Lucia Clarotto
Direction : Thomas RomaryDenis Allard
Type : Thèse de doctorat
Discipline(s) : Géostatistique et probabilités appliquées
Date : Soutenance le 12/06/2023
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique
Partenaire(s) de recherche : Laboratoire : Centre de géosciences (Fontainebleau, Seine et Marne)
établissement de préparation de la thèse : École nationale supérieure des mines (Paris ; 1783-....)
Jury : Président / Présidente : Liliane Bel
Examinateurs / Examinatrices : Thomas Romary, Denis Allard, Emmanuel Gobet, Finn Lindgren, Alessandra Menafoglio, Geir-Arne Fuglstad, Carlo Gaetan
Rapporteurs / Rapporteuses : Emmanuel Gobet, Finn Lindgren

Résumé

FR  |  
EN

L'introduction de modèles statistiques inspirés de la physique des phénomènes sous-jacents et numériquement efficaces est d'un intérêt croissant pour la prédiction de processus spatio-temporels en sciences environnementales. Les grands jeux de données spatio-temporelles nécessitent de nouvelles méthodes numériques efficaces. L'approche par Equations aux Dérivées Partielles Stochastiques (EDPS) s'est avérée efficace pour l'estimation et la prédiction dans un contexte spatial. Nous présentons ici une EDPS d'advection-diffusion avec une dérivée de premier ordre en temps qui définit une grande classe de modèles spatio-temporels non séparables. On construit une approximation de la solution de l'EDPS par un champ aléatoire Markovien Gaussien en discrétisant la dérivée temporelle par la méthode des différences finies (Euler implicite) et en résolvant l'EDPS spatiale par la méthode des éléments finis (Galerkin continu) à chaque pas de temps. La technique de stabilisation "Streamline Diffusion" est introduite lorsque le terme d'advection domine la diffusion. Des méthodes de calcul efficaces sont proposées pour estimer les paramètres de l'EDPS et pour prédire le champ spatio-temporel par krigeage, ainsi que pour effectuer des simulations conditionnelles. L'approche est appliquée à des jeux de données de rayonnement solaire et de vitesse du vent. Ses avantages et ses limites sont examinées, et de nouvelles perspectives de travail sont envisagées, notamment afin de proposer une extension dans un cadre non stationnaire. On présente également un travail portant sur la généralisation non séparable de la classe de Gneiting des fonctions de covariance spatio-temporelles multivariées. Le principal potentiel de l'approche est la possibilité d'obtenir des modèles entièrement non séparables dans un cadre multivarié, et les avantages sont illustrés sur un ensemble de données météorologiques trivariées. De plus, on propose une analyse de méthodes d'estimation et de prédiction approximées pour les données spatiales et spatio-temporelles, motivée par l'objectif de parvenir à un compromis entre l'efficacité statistique et la complexité computationnelle. Ces méthodes se sont avérées efficaces pour l'estimation des paramètres et la prédiction dans le contexte de la "Compétition de statistiques spatiales pour les grands jeux de données" organisée par la King Abdullah University of Science and Technology (KAUST) en 2021 et 2022. Enfin, d'autres pistes de recherche sont envisagées et examinées.