Thèse soutenue

Modèles de graphes probabilistes et méthodes d'apprentissage profond pour l'analyse d'images de télédétection

FR  |  
EN
Auteur / Autrice : Martina Pastorino
Direction : Josiane ZerubiaGabriele Moser
Type : Thèse de doctorat
Discipline(s) : Automatique, traitement du signal et des images
Date : Soutenance le 12/12/2023
Etablissement(s) : Université Côte d'Azur en cotutelle avec Università degli studi (Gênes, Italie)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes)
Jury : Président / Présidente : Jón Atli Benediktsson
Examinateurs / Examinatrices : Josiane Zerubia, Gabriele Moser, Jón Atli Benediktsson, Sébastien Lefèvre, Farid Melgani
Rapporteurs / Rapporteuses : Sébastien Lefèvre, Farid Melgani

Résumé

FR  |  
EN

Grâce aux avancées actuelles des missions spatiales d'observation de la Terre, il est possible d'avoir accès à des images satellitaires à très haute résolution et multimodales. Les données acquises peuvent être optiques (par exemple, images panchromatiques, multispectrales et hyperspectrales) ou radar, avec différentes ouvertures synthétiques et divers compromis entre résolution et couverture. Cela offre un grand potentiel d'application dans le domaine de la télédétection. Un rôle important dans ce contexte est joué par la segmentation sémantique dont le but est d'attribuer chaque pixel d'une image à une classe sémantique, généralement liée à l'occupation du sol ou à l'utilisation des terres, et avec des applications importantes dans des domaines tels que la planification urbaine, l'agriculture de précision, la surveillance des espèces forestières, la gestion des catastrophes naturelles et la surveillance et l'atténuation du changement climatique.La présente thèse se concentre sur le développement de nouvelles méthodes d'analyse de données multimodales visant à exploiter pleinement toutes les informations disponibles multisources, multicapteurs, multirésolutions, etc. dans le domaine de la segmentation sémantique de l'imagerie de télédétection. Ces méthodes combinent des idées issues de modèles stochastiques et d'apprentissage profond. D'une part, l'apprentissage profond est actuellement l'approche dominante en matière de classification et de segmentation d'images. Grâce à leur formulation non paramétrique et aux étapes de traitement intrinsèquement multi-échelles qui caractérisent les réseaux de neurones convolutifs, les architectures d'apprentissage profond peuvent être utilisées efficacement pour la fusion et l'analyse d'images multimodales. Cependant, les performances des méthodes d'apprentissage profond sont remarquablement influencées par la quantité et la qualité de la vérité de terrain utilisée pour l'apprentissage. En revanche, les modèles graphiques probabilistes ont suscité un fort intérêt ces dernières années, en raison du besoin toujours croissant de prédictions structurées. En fonction de la topologie graphique sous-jacente sur laquelle ils sont définis, ils peuvent modéliser efficacement les informations spatiales et multirésolutions. L'objectif principal de la thèse est de développer des approches tirant parti des avantages de ces deux grandes familles méthodologiques - et par leur intégration - pour l'exploitation des données de télédétection multimodales et des informations complémentaires qu'elles véhiculent.Dans ce contexte, premièrement, une nouvelle méthode intégrant une modélisation graphique probabiliste, hiérarchique et causale, des réseaux entièrement convolutifs et, dans une formulation antérieure, des ensembles d'arbres de décision, est proposée. Ensuite, une méthode d'apprentissage profond est développée pour apprendre directement des modèles stochastiques, tels que des champs aléatoires conditionnels, à partir des données d'images d'entrées. Le potentiel de la fusion multimodale de l'imagerie de télédétection avec les données sur la demande de mobilité a été exploité pour proposer un modèle stochastique fondé sur le concept de région, pour la cartographie de l'utilisation des terres dans les zones urbaines. Enfin, des algorithmes de fusion multirésolutions pour la cartographie des zones forestières brûlées à partir de données avec un très grand rapport de résolution sont développés selon des concepts bayésiens, utilisant des graphes probabilistes et les réseaux neuronaux.Le cadre théorique des méthodes développées est décrit en détail dans cette thèse. Les validations expérimentales, réalisées avec des images satellitaires multimodales multispectrales, panchromatiques et radar, montrent l'efficacité des méthodes proposées. Les approches proposées sont également comparées aux méthodes de pointe récemment développées pour des applications similaires de segmentation sémantique.