Thèse soutenue

Approches d'apprentissage automatique pour des sources hétérogènes géologiques de sous-sol

FR  |  
EN
Auteur / Autrice : Molood Arman
Direction : Nacéra Seghouani-BennacerFrancesca BugiottiSylvain WLODARCZYK
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 09/03/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....)
référent : CentraleSupélec (2015-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Anne Vilnat
Examinateurs / Examinatrices : Amel Bouzeghoub, Esteban Zimányi, Hélène Bonneau
Rapporteurs / Rapporteuses : Amel Bouzeghoub, Esteban Zimányi

Résumé

FR  |  
EN

Dans le domaine de l'exploration et de la production du pétrole et du gaz, il est essentiel de comprendre les structures géologiques de sous-sol, tels que les diagraphies de puits et les échantillons de roche, afin de fournir des outils de prédiction et d'aide à la décision. Exploiter des données provenant de différentes sources, structurées ou non structurées, telles que des bases de données relationnelles et des rapports numérisés portant sur la géologie du sous-sol, est primordial. Le principal défi pour les données structurées réside dans l'absence d'un schéma global permettant de croiser tous les attributs provenant de différentes sources.Les défis sont autres pour les données non structurées. La plupart des rapports géologiques de sous-sol sont des versions scannées de documents. L'objectif de notre travail de thèse est de fournir une représentation structurée des différentes sources de données, et de construire des modèles de language spécifique au domaine pour l'apprentissage des entités nommées relatives à la géologie du sous-sol.