Thèse soutenue

Apprentissage actif pour la classification des occupations du sol sur larges étendues à partir d'images multispectrales à haute résolution spatiale : application en milieu cultivé, Lebna (Cap-Bon Tunisie)

FR  |  
EN
Auteur / Autrice : Ines Ben Slimene Ben Amor
Direction : Philippe LagacherieImed Riadh Farah
Type : Thèse de doctorat
Discipline(s) : Sciences du sol
Date : Soutenance le 23/11/2017
Etablissement(s) : Montpellier en cotutelle avec École Nationale des Sciences de l'Informatique (La Manouba, Tunisie)
Ecole(s) doctorale(s) : GAIA (Montpellier ; École Doctorale ; 2015-...)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'étude des interactions sols-agrosystèmes-hydrosystèmes (Montpellier)
Jury : Président / Présidente : Thomas Corpetti
Examinateurs / Examinatrices : Philippe Lagacherie, Imed Riadh Farah, Thomas Corpetti, Abdelaziz Kallel
Rapporteurs / Rapporteuses : Abdelaziz Kallel

Résumé

FR  |  
EN

Les activités anthropiques dans le bassin méditerranéen sont en forte évolution. Dans les zones agricoles, cette croissance entraîne des évolutions considérables de l'occupation du sol. Cette activité agricole exerce un impact majeur sur le fonctionnement hydrologique des paysages qui n'est identifiable qu'à une échelle bien plus large, sur plusieurs dizaines de km². Cette thèse se concentre sur la classification de l'occupation du sol sur une large étendue à partir d'une image monodate à haute résolution spatiale (SPOT6/7).Dans ce contexte, les données d'apprentissage sont collectées par des enquêtes terrain, par conséquent, elles sont très limitées. Les méthodes d'apprentissage supervisées sont généralement utilisées, en supposant que la distribution des classes est stable sur toute l'image. Cependant, en pratique, on constate une distorsion des distributions des classes (apparition de nouvelles classes, disparition de classes). Ce problème, intitulé "datashift", se produit souvent sur des larges étendues. Ainsi le modèle construit sur les données d'apprentissage initiales s'avère sous optimal pour la classification de l'image entière. Pour atténuer ce problème, les techniques d'apprentissage actif définissent un ensemble d'apprentissage efficace, en l'adaptant itérativement par l'ajout des données non labellisées les plus informatives. Ces techniques permettent d'améliorer le modèle de classification tout en conservant un petit ensemble d'apprentissage initial. L'échantillonnage se base généralement sur deux métriques : l'incertitude et la diversité.Dans cette thèse, nous montrons l'apport des techniques d'apprentissage actif pour la cartographie de l'occupation du sol en milieu agricole, en proposant un échantillonnage adapté par parcelle.L'apport des méthodes d'apprentissage actif est validé par rapport à une sélection aléatoire des parcelles. Une métrique de diversité basée sur l'algorithme Meanshift a été proposée.Dans un deuxième temps, nous avons traité le sous-problème du "datashift" qui est l'apparition de nouvelles classes. Nous avons proposé de nouvelles métriques de diversité basées sur l'algorithme Meanshift et les Fuzzy k-means ainsi qu'une nouvelle stratégie de sélection des données adaptées à la détection de nouvelles classes.Dans la dernière partie, nous nous sommes intéressés aux contraintes spatiales induites par les observations sur terrain et nous avons proposé une stratégie de labellisation par points de vue qui permet de diminuer largement les coûts humains d'observations terrain tout en gardant de bonnes précisions de classification ainsi que la découverte des nouvelles classes.Les méthodes proposées ont été testées et validées avec une image multispectrale SPOT6 à 6m de résolution sur le bassin versant de Lebna, Cap-Bon, Tunisie.