Apprentissage profond de représentations physiques de la végétation à partir de séries temporelles d'images satellite optiques
| Auteur / Autrice : | Yoël Zérah |
| Direction : | Jordi Inglada, Sylvia Valero |
| Type : | Thèse de doctorat |
| Discipline(s) : | Surfaces et interfaces continentales, Hydrologie |
| Date : | Soutenance le 20/06/2024 |
| Etablissement(s) : | Université de Toulouse (2023-....) |
| Ecole(s) doctorale(s) : | École doctorale Sciences de l’univers, de l’environnement et de l’espace (Toulouse) |
| Partenaire(s) de recherche : | Laboratoire : Centre d'études spatiales de la biosphère (Toulouse ; 2001-....) |
| Etablissement de délivrance conjointe : Université Toulouse 3 Paul Sabatier (1969-2024) | |
| Jury : | Président / Présidente : Thomas Oberlin |
| Examinateurs / Examinatrices : Jan Wegner | |
| Rapporteurs / Rapporteuses : Devis Tuia, Gustau Camps-Valls |
Mots clés
Résumé
Le changement climatique initié par les activités humaines provoque des transformations drastiques et sans précédent des écosystèmes et des zones habitées dans le monde entier. La télédétection s'impose comme un outil essentiel pour observer la Terre, pour comprendre le fonctionnement de la biosphère ainsi que son altération par les pressions anthropiques. Les capacités d'observation par télédétection spatiale ainsi que les techniques de traitement du signal ont rapidement évolué lors des dernières décennies. L'émergence des techniques d'apprentissage statistique modernes et l'augmentation exponentielle de la puissance de calcul disponible sont cruciaux dans l'exploitation de l'immense volume de données produit par les capteurs de télédétection. En particulier, la mission S2 produit des images multi-spectrales à haute résolution spatiale et temporelle depuis une dizaine d'années à une échelle globale, diffusées gratuitement avec une politique d'accès libre. Les produits S2 ont permis le développement de diverses applications, telles que l'amélioration des techniques agricoles, la gestion du territoire et la réponse aux catastrophes naturelles. Les données de télédétection sont des mesures de radiations électromagnétiques dont les caractéristiques sont reliées à la nature des éléments et aux processus à la surface de la Terre. L'extraction de représentations contenant des informations pertinentes sur ces éléments est fondamentale pour les applications de télédétection. L'objectif de cette thèse est de proposer une méthode d'inférence de telles représentations à partir de données de télédétection. Plusieurs défis se présentent pour estimer ces représentations. D'abord, elles doivent êtres générales et interprétables, afin d'être utilisables par plusieurs applications. Cela peut être réalisé avec des variables bio-physiques qui caractérisent les systèmes observés, par exemple le contenu minéral et en eau des sols ou la concentration en pigments et la structure de la canopée pour la végétation, ainsi que son évolution temporelle. Par ailleurs, les représentations doivent êtres associées à une incertitudes d'estimation. Le manque de données de référence pose aussi un défi. Contrairement aux acquisitions de télédétection, il est difficile d'obtenir des vérités terrain. Les bases de données qui associent des variables bio-physiques de la végétation et des données de télédétection sont rares. Les approches qui estiment ces variables utilisent donc la modélisation physique et l'inversion. Cette thèse est divisée en trois parties principales qui détaillent ses quatre contributions. La première contribution est la démonstration de la dépendance des modèles de régression supervisée au choix de la distribution d'échantillonnage pour leur jeu de données d'entraînement. La seconde contribution est le développement d'une méthodologie d'estimation de variables physiques non supervisée à partir de données de télédétection, basée sur les Autoencodeurs Variationnels (VAE). Cela consiste en l'incorporation de modèles et de connaissances physiques à priori dans un modèle d'apprentissage profond. Cette approche utilise la reconstruction comme tâche intermédiaire pour estimer une variable physique, plutôt que la comparaison avec une vérité terrain indisponible ou une référence simulée. Dans une troisième partie, ce manuscrit détaille les deux autres contributions de cette thèse : l'application de la méthodologie proposée à l'estimation de variables physiques dans deux applications. Dans la première le modèle de transfert radiatif PROSAIL est utilisé dans le modèle PROSAIL-VAE afin d'estimer les caractéristiques de feuilles et de la canopée à partir d'images S2. La validation avec des données in-situ a permis de confirmer les performances de cette approche. Dans la seconde application, des variables phénologiques caractérisant le comportement temporel de la végétation sont estimées à partir de séries temporelles de NDVI, avec le modèle Phéno-VAE