Thèse soutenue

Bibliométrie, détection de changement et apprentissage multimodal sur des données d'observation de la Terre : le cas de la déforestation

FR  |  
EN
Auteur / Autrice : Nathalie Neptune
Direction : Josiane Mothe
Type : Thèse de doctorat
Discipline(s) : Informatique et Télécommunications
Date : Soutenance le 15/07/2022
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....) - Institut de recherche en informatique de Toulouse / IRIT
Jury : Président / Présidente : Florence Sèdes
Rapporteurs / Rapporteuses : Mathieu Roche, Muriel Visani

Résumé

FR  |  
EN

En raison de la déforestation et de la dégradation affectant de nombreuses zones forestières, il est nécessaire de détecter et de surveiller l'état des forêts. Dans cette thèse, nous présentons des méthodes automatiques pour analyser des images satellites et des documents scientifiques, séparément et conjointement, pour détecter la déforestation. Ce travail, appliqué à la déforestation, reste générique et peut s'appliquer à d'autres domaines dans lesquels des images d'observation peuvent être annotées à partir de publications au sujet du phénomène à annoter. Nous présentons notre travail d'analyse des publications liées à la déforestation couvrant plusieurs décennies. Nos méthodes offrent une nouvelle approche prometteuse pour l'analyse des données environnementales afin d'étudier à grande échelle des informations sur la déforestation ou d'autres sujets. Nous proposons d'extraire les meilleurs mots-clés d'un corpus de publications scientifiques sur un même sujet, après avoir retiré les documents les moins pertinents de ce corpus en fonction de leur titre. Pour ce faire, nous utilisons des plongements de phrases et des mesures de similarité sémantique. En utilisant notre approche sur les corpus liés à la déforestation, nous obtenons les meilleurs mots-clés principalement liés à ce sujet. Nous proposons d'annoter des paires d'images satellites de forêts ayant subi des changements, avec des mots-clés de publications scientifiques. Les paires d'images sont annotées avec les mots qui leur ressemblent le plus. Nous utilisons une représentation commune des images et des mots-clés extraits des publications, à l'aide de réseaux de neurones. Nous trouvons les mots-clés les plus similaires à la paire d’images dans cet espace commun avec la mesure de similarité du cosinus. Avec notre approche, nous constatons que les corpus qui sont liés aux forêts en général, et à la région d'intérêt plus spécifiquement, peuvent être utilisés pour annoter automatiquement et de façon pertinente les images. Nous montrons que ces corpus donnent de meilleurs résultats que l'utilisation d'un corpus plus générique comme Wikipedia.