Thèse soutenue

Modélisation physico-statistique de la dynamique des océans basée sur l'apprentissage profond

FR  |  
EN
Auteur / Autrice : Marie Déchelle-Marquet
Direction : Patrick GallinariMarina Lévy
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 10/05/2023
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : Institut des systèmes intelligents et de robotique (Paris ; 2009-....)
Jury : Président / Présidente : Claire Monteleoni
Examinateurs / Examinatrices : Julien Le Sommer
Rapporteurs / Rapporteuses : Cécile Mallet, Marc Sebban

Résumé

FR  |  
EN

La modélisation des phénomènes dynamiques en géophysique repose sur une compréhension de la physique sous-jacente, décrite sous la forme d'EDP, et sur leur résolution par des modèles numériques. Le nombre croissant d'observations de systèmes physiques, l'essor récent de l'apprentissage profond et l'énorme puissance de calcul requise par les solveurs numériques, qui entrave la résolution des modèles existants, suggèrent que l'avenir des modèles physiques pourrait être orienté données. Mais pour cela, l'apprentissage profond doit relever plusieurs défis, tels que l'interprétabilité et la cohérence physique des modèles, qui sont encore largement sous-estimés par la communauté de l'apprentissage profond. Dans cette thèse, nous étudions la prédiction de la température de surface de la mer (SST) à l'aide de modèles hybrides, combinant un modèle physique et un modèle orienté données (un réseau de neurones). Assurer la plausibilité physique des modèles hybrides nécessite de bien poser leur apprentissage : sinon, la grande versatilité des réseaux neuronaux peut conduire la partie orientée données à contourner le modèle physique. Notre étude est divisée en deux parties : une étude théorique sur les modèles hybrides et une confrontation pratique de notre modèle à des simulations de données réelles. Tout d'abord, nous proposons un nouveau cadre générique d'apprentissage bien posé basé sur l'optimisation d'une borne supérieure de l'erreur de prédiction. Deuxièmement, nous étudions des observations océaniques réelles de la SST et des champs de vitesse du courant Gulf Stream dans l'Atlantique Nord (à partir du modèle NATL60). Cette application met en évidence les défis posés par la confrontation de l'apprentissage automatique de phénomènes physiques à la complexité de la physique du monde réel.