Thèse soutenue

Mise en relation de données hétérogènes pour le renforcement des systèmes de sécurité alimentaire – Cas de la production agricole en Afrique de l’Ouest

FR  |  
EN
Auteur / Autrice : Hugo Deleglise
Direction : Mathieu RocheMaguelonne Teisseire
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 15/12/2021
Etablissement(s) : Montpellier
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Territoires, Environnement, Télédétection et Information Spatiale (Montpellier)
Jury : Examinateurs / Examinatrices : Mathieu Roche, Maguelonne Teisseire, Josiane Mothe, Stan Matwin, Pierre Gançarski, Roberto Interdonato
Rapporteurs / Rapporteuses : Josiane Mothe, Stan Matwin

Résumé

FR  |  
EN

Les progrès dans la lutte contre la faim ont été significatifs en Afrique de l’Ouest et au Burkina Faso entre 2000 et 2014, avant que la situation alimentaire ne se détériore. Les raisons sont multiples et interdépendantes : des phénomènes météorologiques extrêmes plus fréquents et l'augmentation de la population tendent à réduire la disponibilité alimentaire ; les déplacements de population dus aux conflits ont pour conséquence la chute de la production agricole et la désorganisation des circuits de distribution ; la pauvreté structurelle des populations est aggravée par un contexte économique mondial difficile. Pour suivre, analyser et prévoir les situations d'insécurité alimentaire, les systèmes de sécurité alimentaire (SSA) intègrent principalement des données agroclimatiques issues d’images satellites et des indicateurs de nutrition, de production et d’économie issus d’enquêtes ménages. Ces enquêtes sont essentielles à la production d’indicateurs clés pour mesurer la sécurité alimentaire (SA), mais sont coûteuses économiquement et en temps.L'objectif de cette thèse est de fournir des approches innovantes pour l’estimation d’indicateurs de SA et de leurs déterminants, en utilisant des données hétérogènes publiquement accessibles et des approches fondées sur l’intelligence artificielle, dans la perspective d'appuyer les méthodes utilisées par les SSA. Pour cela, plusieurs questions de recherche sont traitées : sur quels indicateurs s’appuyer pour mesurer la SA et quelles en sont les limites ? Comment traiter l’hétérogénéité thématique, temporelle et spatiale des données ? Comment extraire des éléments explicatifs à partir des données ? Pour répondre à ces problématiques, cette thèse propose trois contributions.Premièrement, nous faisons un état des lieux des nombreux indicateurs utilisés pour quantifier cette notion complexe qu’est la SA. Puis, nous nous concentrons sur des indicateurs de SA issus d’enquêtes ménages et étudions ce qu’ils nous révèlent sur la SA, leur validité spatiale et temporelle, ainsi que les biais auxquels ils peuvent être sujets. Nous montrons que malgré leurs biais inhérents, ces indicateurs contiennent des informations spatiales et interannuelles cohérentes qui peuvent être exploitées pour le suivi des crises alimentaires au niveau sub-national.Deuxièmement, nous proposons des approches originales combinant des méthodes d'apprentissage automatique et profond (i.e., forêts aléatoires, réseaux de neurones convolutifs, réseaux de neurones récurrents) pour obtenir des approximations d’indicateurs de SA issus d’enquêtes ménages. Ces approches intègrent et combinent des données explicatives hétérogènes. Les données explicatives sont des variables quantitatives (e.g., données météorologiques), des images (e.g., densités de population, occupation des sols) et des points GPS (e.g., hôpitaux, écoles, événements violents) avec différentes granularités spatio-temporelles. Nous mettons en évidence la pertinence des approches d'apprentissage automatique selon les données à traiter et constatons l’apport significatif de variables issues de domaines variés.Troisièmement, nous étudions l’apport des données textuelles, possédant un fort potentiel explicatif, pour effectuer une analyse qualitative de la SA en nous basant sur un corpus de journaux burkinabés. Nous examinons la capacité des méthodes de fouille de textes à extraire automatiquement des informations qualitatives sur la situation alimentaire globale, régionale et annuelle à partir de ce corpus. Ce travail a permis d'obtenir des informations qualitatives spécifiques sur la thématique de la SA et sur ses caractéristiques spatiale et temporelle.A travers ces trois contributions, cette thèse considère la problématique de l’hétérogénéité des données liées à la SA en mettant l’accent sur les dimensions spatio-temporelles et thématiques qu’elles véhiculent. Les cadres méthodologiques génériques proposés pourront être étendus et adaptés à d’autres domaines.