Développement de nouvelles méthodes d’homogénéisation des données atmosphériques GNSS. Application à l’étude de la variabilité climatique.
Auteur / Autrice : | Annarosa Quarello |
Direction : | Olivier Bock, Emilie Lebarbier |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de l'environnement |
Date : | Soutenance le 15/12/2020 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Sciences de l'environnement d'Île-de-France (Paris ; 1992-....) |
Partenaire(s) de recherche : | autre partenaire : Institut de physique du globe (Paris ; 1921-....) |
Laboratoire : UMR-Institut de physique du globe de Paris (2005-....) | |
Jury : | Président / Présidente : Laurence Picon |
Examinateurs / Examinatrices : Emilie Lebarbier, Olivier Mestre, Céline Lévy-Leduc | |
Rapporteurs / Rapporteuses : Guillem Rigaill, Enric Aguilar |
Mots clés
Résumé
L'homogénéisation est une étape importante et cruciale pour améliorer l'utilisation des données d'observation pour l'analyse du climat. Ce travail est motivé par l'analyse de les données journalières de Contenu Intégré en Vapeur d’Eau (CIVE) mesurées par GNSS (Global Navigation Satellite Systems), appelées GNSS CIVE (IWV Integrated Water Vapor en anglais) qui n'ont pas encore été utilisées dans ce contexte. Ces séries sont affectées par des inhomogénéités liées à des changements dans l'instrumentation, dans l'environnement et dans la procédure de traitement des données. En raison de la variabilité naturelle de la série, nous travaillons en fait sur la série chronologique des différences, en utilisant la réanalyse ERA-Interim comme référence pour le signal climatique. Une hypothèse de base est que les différences contiennent seulement la signature des changements brusques de la série GNSS qui peuvent être détectés au moyen d'un algorithme de segmentation. Une analyse minutieuse des résultats de la segmentation permet de trier les cas où cette hypothèse n'est en fait pas vraie. La principale contribution de cette thèse a été le développement d'une nouvelle méthode de segmentation dédiée à la détection des changements dans la moyenne de la série de différences GNSS-ERA-Interim CIVE. Ce modèle de segmentation intègre un biais périodique et une variance hétérogène, variable mensuellement, pour s'adapter correctement aux caractéristiques de la série. La méthode consiste à estimer d'abord la variance à l'aide d'un estimateur robuste puis à estimer les paramètres de segmentation (les positions des points de changement, les moyennes des segments) et le modèle de biais périodique de manière séquentielle. Les paramètres de segmentation et le modèle de biais périodique sont estimés de manière itérative pour un nombre fixe de points de changement. L'inférence est obtenue par la procédure classique du maximum de vraisemblance en utilisant l'algorithme de programmation dynamique pour l'estimation des paramètres de segmentation qui fournit la solution exacte dans un laps de temps raisonnable. La procédure est répétée pour tous les nombres de points de changement testés entre 0 et un maximum (environ 30). Enfin, le nombre optimal de points de changement est choisi en utilisant une stratégie de sélection de modèle pénalisée. Plusieurs critères sont testés. La méthode est implémentée dans le package R GNSSseg disponible sur CRAN. Les performances de la méthode proposée ont été évaluées par des simulations numériques. Une application pour un ensemble de données réel de 120 stations GNSS mondiales dans le réseau mondial IGS est présentée pour la période de janvier 1995 à décembre 2010. L'inspection des résultats révèle que les points de changement détectés contiennent une fraction (~20%) de valeurs aberrantes qui se caractérisent par des détections doubles avec deux grands décalages, généralement de signes opposés, rapprochés, p.ex. à quelques dizaines de jours d'intervalle. Afin de détecter et d'éliminer les valeurs aberrantes, une méthode de dépistage a été développée. L'ensemble final de points de changement est validé par rapport aux métadonnées GNSS qui contiennent des informations sur les changements d'équipement survenus dans les stations. Le pourcentage de validation reste modéré au niveau de 20% malgré tous les changements sont statistiquement significatifs. Certains des points de changement peuvent en fait être dus à la série de référence (ERA-Interim). Enfin, les informations de segmentation (dates des points de changement) sont incluses dans un algorithme de régression linéaire qui est utilisé pour estimer les tendances GNSS CIVE. Les tendances estimées sont testées pour leur signification et comparées aux tendances ERA-Interim. Une plus grande cohérence spatiale dans les tendances GNSS et une meilleure cohérence sont trouvées après l'homogénéisation avec ERA-Interim dans les régions où la réanalyse est connue pour ses performances...