Thèse en cours

Modélisation probabiliste des réseaux de failles par graphe sur des données éparses: connaissance experte et apprentissage automatique

FR  |  
EN

Accès à la thèse

AttentionLa soutenance a eu lieu le 03/02/2026. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Amandine Fratani
Direction : Guillaume CaumonRadu Stefan Stoica
Type : Projet de thèse
Discipline(s) : Géosciences
Date : Inscription en doctorat le
Soutenance le 03/02/2026
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : École doctorale SIReNa - Science et ingénierie des ressources naturelles
Partenaire(s) de recherche : Laboratoire : GeoRessources
Jury : Président / Présidente : Marianne Clausel
Examinateurs / Examinatrices : Guillaume Caumon, Roger Soliva, Edith Gabriel, Radu Stoica, Mike Pereira
Rapporteurs / Rapporteuses : Roger Soliva, Edith Gabriel

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les failles sont des zones structurantes du sous-sol qui contrôlent fortement les circulations de fluides, résultant de la rupture de la roche en deux blocs avec un déplacement relatif. Leur étude en subsurface est complexe en raison des lacunes d'information entre les données disponibles. La modélisation stochastique permet d'estimer les incertitudes géologiques et topologiques en générant de multiples modèles, mais elle ne prend pas toujours en compte tous les types d'incertitudes, notamment lors de l'association d'observations fragmentaires. Dans cette thèse, je m'intéresse précisément aux incertitudes liées à l'étape d'association des observations de failles et au manque de données structurales pour l'apprentissage automatique. Les travaux se déclinent en trois contributions principales. Le premier axe étend un formalisme de graphe initialement conçu pour des données sismiques vers les données de forage, beaucoup plus nombreuses. Trois règles expertes exploitant la position, l'orientation et l'ouverture des failles sont introduites, ainsi qu'un nouvel algorithme d'échantillonnage capable de gérer efficacement de grands volumes d'observations. Les tests sur données synthétiques montrent que l'approche permet d'identifier des associations cohérentes, bien que son paramétrage soit complexe et que la prise en compte exclusive de paires limite le réalisme géologique. Le deuxième axe vise à dépasser cette limite en modélisant explicitement les interactions entre plusieurs observations. Pour cela, deux modèles de forêts aléatoires sont entraînés sur des paires et des triplets d'observations issues de modèles structuraux 3D, et un modèle analytique est proposé pour combiner ces potentiels au sein d'un graphe unique. Les résultats révèlent que les triplets apportent des informations complémentaires importantes, améliorant la qualité des potentiels, même si la génération de scénarios d'association pleinement cohérents reste un défi. Enfin, le troisième axe répond au manque de données d'entraînement en développant une méthode de génération de modèles structuraux synthétiques réalistes. Une version modifiée du logiciel Noddy est paramétrée à partir d'une formalisation mathématique des connaissances géologiques pour produire des réseaux de failles caractéristiques des bassins extensifs (horst-graben, failles en domino). Dix modèles ont été générés, montrant un réalisme prometteur malgré certaines limitations liées aux capacités du logiciel. Ensemble, ces contributions renforcent la capacité à quantifier les incertitudes de modélisation structurale, à mieux représenter les interactions entre observations et à fournir des jeux de données structuraux adaptés à l'apprentissage automatique.